Zuzana Roznosová: Hlas máte pořád s sebou | Firmaroku.cz
Příběhy úspěšných > Zuzana Roznosová: Hlas máte pořád s sebou

Zuzana Roznosová: Hlas máte pořád s sebou

Provozní ředitelka společnosti Phonexia, IBM Firma roku 2021 Jihomoravského kraje, nás v rozhovoru seznámila s ne příliš hmatatelným, ale o to perspektivnějším, oborem podnikání...
13. 10. 2021 | Firma roku

Pojďme vysvětlit, co je předmětem vaší práce?
Předmětem práce Phonexie je využívat hlasové technologie, ideálně v každodenním životě. V současné době je naším hlavním produktem identifikace mluvčího, který dodáváme hlavně do vládních segmentů, dalo by se říci po celém světě, do více než padesáti zemí. Nově se tuto technologii snažíme dodat do komerčního sektoru pod názvem Voice Verify. Měla by sloužit jako paralelní autentifikační metoda například v call centrech. A vidíme, že do budoucna se dá hlas využívat v celé řadě dalších scénářů. Například v Africe, kde lidé nemůžou dojet k doktorovi, by se mohli autorizovat hlasem a byla by jim poskytnuta péče. Existuje řada dalších možností, například pro pojišťovny. Druhá technologie je přepis řeči na text, který je pak používaný třeba ve voicebotech nebo při vyhledávání klíčových slov. Do budoucna věříme, že hlasová technologie může fungovat v řadě dalších aplikací, uživatelských rozhraních, protože hlas je takový přirozený moment, máte ho pořád s sebou a je to unikátní věc, něco jako otisk prstu.

Jak se ze společnosti z Jihomoravského kraje stane celosvětová firma?
Myslím, že za to vděčíme dlouhodobé špičkové práci výzkumníků a vědců v oblasti hlasové technologie. Phonexia vznikla před patnácti lety z hlasové skupiny na Fakultě informačních technologií. S několika lidmi dodnes na některých výzkumných projektech spolupracujeme. Naši vlastníci jsou špičkoví vědci v této oblasti, a tím mohl začít vznikat software, technologie, v současné době i řešení a produkt, který jsme schopni dodat po celém světě. Výhodou technologie identifikace mluvčího je, že je jazykově nezávislá, to znamená, že ten model funguje všude po světě, protože hlas je unikátní, ač se mluví jakýmkoliv jazykem. Ještě bych řekla jednu věc, když se mluví o Phonexii, tak to pro mě je skvělý tým lidí, harmonie, obrovská inovace, hledání nových cest.

Jak se v zahraničí dokážete dostat ke svým potenciálním zákazníkům?
Historicky jsme hodně využívali návštěvy zahraničních veletrhů. Jsou veletrhy, kde se prezentují naši zákazníci, jako je například ISSS v Praze, ale kolegové jezdí do Dubaje, do Kuala Lumpuru nebo Panamy. V poslední době více rozvíjíme webové stránky a blog, který byl vyhodnocen jako nejužitečnější pro sledování pro hlasovou technologii. Pak jsou to kontakty, reference zákazníků, je to multikanálová záležitost.

Jak velkou část práce tvoří vlastní výzkum a jakou obchod?
Phonexia má aktuálně šedesát zaměstnanců a výzkumu věnujeme stále velkou pozornost. Vývojové oddělení tvoří asi polovinu firmy, z toho jsou vývojáři v různých jazycích, kdy už programují technologii, ale ti úzce spolupracují s týmem výzkumníků. Je to tým šesti lidí, kteří zase úzce spolupracují s tím primárním výzkumem třeba na Fakultě informačních technologií nebo na ostatních univerzitách. A tím, že jsme tak úzce propojeni, tak jsme schopni poznatky přenášet do našeho produktu. Produktoví manažeři posbírají tipy, co by zákazníci v té které oblasti chtěli zkoumat a to u nás jde do výzkumného týmu. Ten dělá různé experimenty pro lepší programování ve vlastním softwaru. Letos se nám podařilo pořídit dobrou infrastrukturu pro všechny výpočty, máme novou servrovnu. Spolupracujeme s předním světovým výzkumníkem Niko Brummerem.

Kde jsou limity vašeho oboru?
Každá technologie má nějaký limit, který se ale neustále posouvá tím, že ve výzkumu vznikají úplně nové věci. V identifikaci mluvčího, tam kolegové před dvěma roky zapracovali neuronové sítě, které pozvedly technologii dál. Samozřejmě každý vyhodnocuje úspěšnost jinak. Hraje se hodně na přesnost a na rychlost autentizace, což je v komerčním sektoru důležité. Když spolu budeme mluvit tři čtyři sekundy, tak vy už byste chtěl s větší jistotou vědět, jestli jsem to já nebo ne. Třeba v call centru je důležité vědět, jestli volá někdo, kdo mě třeba chtěl podvést, mám jeho otisk hlasu, tak už můžu porovnávat. Aktuálně se využívá dvoufázová autentifikace, to znamená že hlas můžete úspěšně použít párově s jinou technologií. To se snažíme prosazovat například v bankách.