Vědci vyvíjejí systém, který rozpozná hlas konkrétních lidí

Vědci z Brna vyvíjejí systém, který rozpozná hlas konkrétních lidí a to i ve statisících nahrávkách. Výsledky výzkumu je možné využít v bezpečnostní oblasti i v bankovnictví.

Systém by podle vědců mohl například pomoci policii v tisících telefonních hovorech zachytit ten, kde mluví mezinárodně hledaný zločinec. Bankám by zase pomohl ověřovat, zda zadávat platby po telefonu chce opravdu majitel účtu. Vědci z Vysokého učení technického v Brně se svými výsledky uspěli v celosvětovém klání, které organizuje Národní úřad pro standardizaci a technologie ve Spojených státech, uvedl za tým Jan Černocký.

"Jedná se o to, že mnoha laboratořím po světě pošlou data na ověřování mluvčího. Jsou tam páry nahrávek a my máme říct, zda jsou nahrávky od stejného mluvčího nebo nejsou. My jsme dosáhli opravdu vynikajících výsledků. Teď se s nimi právě chlubíme na workshopu, který probíhá u nás na fakultě v Brně."

Vědci věří v uplatnění svých výsledků v praxi, spolupracují už se soukromou sférou i státem. Jan Černocký v rozhovoru pro Radio Praha prozradil, jak vlastně systém funguje.

"Funguje to tak, že se nahraje řeč, pak se na takových kratičkých časových úsecích spočítají parametry a ty jsou zpracovávány statistickými modely."

Jan Černocký
Jak dlouho na systému pracujete?

"Jako skupina zpracování řeči na fakultě informačních technologií VUT v Brně existujeme od roku 1998 a na systémech pro ověřování mluvčího pracujeme intenzivně od roku 2005 nebo 2006."

Ve kterých oblastech je nejpravděpodobnější využití vašeho systému?

"Třeba v provozu call center, ale největší využití to má v oblasti bezpečnosti a obrany při bezpečnostní analýze telefonních hovorů."

Jakou má systém úspěšnost?

"Záleží, jak máme dlouhou nahrávku, jestli ten mluvčí mluvil v zašuměném prostředí nebo v čistém. Ideální je, když máme 2,5 minuty řeči a vždy po telefonu, tak to asi v 98 procentech případů ten systém dokáže přesně říct, zda to ten mluvčí byl nebo nebyl."

Co když mám třeba rýmu?

"Samozřejmě bude úspěšnost toho systému horší, protože se trošku změní parametry vašeho hlasového ústrojí. Ale na druhou stranu máme systém, který se skládá z několika podsystémů. Některé splete, ale ty, které jsou založeny na parametrech jak frázujete, jakou máte větnou melodii, jak silně mluvíte, jak tu energii řeči modulujete, tak ten systém spletený nebude."

Dokáže váš systém obelstít imitátor?

"Imitátoři se zaměřují na prvoplánovou modifikaci hlasu. Pracují s melodií, délkami hlásek, pracují také se slovy. Základem imitátora je, aby ovládl typický slovník mluvčího, kterého imituje. My se zaměřujeme na parametry hlasového ústrojí. To příliš imitovat nejde."