Brněnská společnost slaví mezinárodní úspěch s technologií rozpoznávání řeči

Rozpoznávání řeči a práce s ní je v dnešní době velmi důležitou technologií, která se neustále vyvíjí. Své o tom ví i úspěšná brněnská firma Phonexia, která vyvíjí technologii pro analýzu řeči a hlasovou biometrii. Podle hospodářských výsledků se jí za poslední dobu velmi daří, za loňský rok zvýšila svůj obrat o 90 procent a růst plánuje i nadále.

Phonexia byla založena v roce 2006 týmem vědců z brněnské Fakulty informačních technologií VUT. Technologie kterou společnost vyvíjí nachází zatím uplatnění především v zahraničí, odkud také pochází 80 procent obratu společnosti. „Naše technologie analyzují hlas z nahrávky či telefonického rozhovoru a na základě toho umožňují identifikovat řečníka, jeho pohlaví nebo přibližný věk. Stejně tak dokáží z několika hlasů a ruchů najednou vytáhnout hlas konkrétní osoby, monitorovat výskyt konkrétních frází v řeči a mluvené slovo přepsat do psané podoby. Využití nachází jak v komerční sféře, tak při identifikaci pachatelů trestných činů nebo odhalování možných teroristických hrozeb. V komerčním sektoru se naše technologie mohou uplatnit například u služeb hlasových asistentů, při hlasové autorizaci úkonů v bankách či pojišťovnách, nebo v call centrech, kterým naše produkty umožňují analyzovat kvalitu hovorů a následně je zlepšovat,” uvádí Michal Hrabí, CEO společnosti Phonexia.

Technologie Phonexie má výhodu, že dokáže fungovat i ve velmi hlučném prostředí (jako je například průmyslová výroba). O jejích možnostech vyšel v nedávné době článek v prestižním Journal of the Acoustical Society of America. Pokus, který tento magazín uspořádal, dokázal, že v podmínkách, kde téměř nebyl slyšet hlas v důsledku okolního hluku rozeznal jazyk a pohlaví mluvčích, identifikoval je a rozlišit jednotlivé osoby mezi sebou.

V letošním roce zaznamenala společnost další pokrok díky technologii Deep Embeddings, která jako první na světě využívá hluboké neuronové sítě pro identifikaci a ověření mluvčího. Ta umožní vytvořit unikátní otisk každého hlasu a díky tomu přesně rozpoznat kdo a s jakými právy vydává příkazy. „Očekáváme, že díky nové technologii pronikneme do nových segmentů, jako je třeba industry 4.0, automobilový průmysl, chytré hodinky, Internet věcí nebo zařízení bez stálého připojení k internetu,” říká Petr Schwarz, CTO společnosti Phonexia.