Vše od nástroje na rozpoznání použitého jazyka po ověřování identity volajícího pomocí hlasu nabízí brněnská Phonexia. Z projektu šesti akademiků se za patnáct let stal přední globální hráč na poli řečové analytiky a hlasové biometrie a jejich technologii, která jako první na světě používá výhradně neuronové sítě, si kromě množství mezinárodních korporací pořídila i policejní oddělení po celém světě.
Tento hovor může být monitorován. Věta, která v dnešní době zaznívá téměř při každém kontaktu s bankou, mobilním operátorem či třeba poskytovatelem energií. Ačkoliv pro většinu volajících tato věta mnoho neznamená, pro kontaktní centra je v každodenní práci velmi důležitá. Znamená totiž zvýšení bezpečnosti i zefektivňování práce a služeb. „Když věta o monitoringu zazní, velmi často na pozadí běží naše technologie. Ty například projdou nahrávky a poskytnou manažerovi kontaktního centra report, co se celý den na pracovišti děje. Jestli se zaměstnanci k zákazníkům chovají slušně, zda jim opravdu pomohli nebo jestli jim nezapomněli nabídnout nějaký produkt," vysvětluje Michal Hrabí, CEO Phonexie.
Brněnská firma Phonexia, čítající dnes na pětašedesát lidí, byla založena před patnácti lety výzkumníky z Fakulty informačních technologií Vysokého učení technického v Brně (VUT). V současnosti se řadí mezi světovou špičku a kromě komerčních zákazníků, jakou jsou innogy, Škoda Auto či O2, její produkty hojně využívají i vládní instituce.
Z projektu šesti výzkumníků je dnes firma o pětašedesáti lidech
Technologie z Brna tak pomáhají řešit například ty nejsložitější kriminální případy v Německu. „Mezi naše zákazníky patří i Bundeskriminalamt. Je to taková německá FBI, ke které se dostávají ty nejkomplexnější zločiny,” potvrzuje Hrabí. Forenzním laboratořím umožňují brněnské nástroje posoudit například to, zda se zachycený hlas shoduje s hlasem podezřelého.
Za úspěchem nestojí zázrak, ale krev, pot a slzy
To, proč se právě brněnské firmy i odborníci řadí mezi celosvětovou špičku v řečových technologiích, vysvětluje Michal Hrabí jednoduše. „Není za tím žádný zázrak. Není to jako když nějaký stát náhodou narazí na ropu. Jsou za tím krev, pot a slzy. Už na konci 90. let se zformovala skupina kolem docenta Černockého z VUT, který k tématu přičichl během doktorátu ve Francii. Začali se tomu věnovat a věnují se tomu doteď. A když na něčem pětadvacet let kontinuálně pracujete, tak se dostanete do první ligy,” říká Hrabí a upozorňuje na přetrvávající úzkou spolupráci mezi univerzitou a firmou. „Stále spolu máme výzkumné projekty a také se společně hlásíme do různých soutěží,” dodává.
I přesto, že je Phonexia na trhu už patnáct let, na širší možnosti uplatnění vyvinutých technologií si musela počkat. „Řečové technologie samy o sobě existují už někdy od sedmdesátých let. Zpočátku to ale byly spíš laboratorní experimenty bez většího komerčního využití. Nicméně od devadesátých let se postupně rozšiřuje množství průmyslových odvětví, kde tyto technologie nacházejí uplatnění,” přibližuje Hrabí. Hodně tomu podle něj prospěl Amazon s Alexou a Apple se Siri. „Obě firmy nainvestovaly do rozvoje obrovské peníze. A díky nim se zase z hlasových technologií stává téma, protože s nimi začínají přicházet do styku i běžní spotřebitelé,” vysvětluje Hrabí.
Ověřit volajícího zvládne systém za tři vteřiny
S rostoucími možnostmi využití i s pronikáním do každodenního života začínají přirozeně narůstat i snahy technologie zneužít. Michal Hrabí si ale myslí, že nabourávání systémů či falšování lidského hlasu stále představuje příliš velké úsilí. Podvodníkům se tak vyplatí dostat se například k bankovním účtům jinak. „Ačkoliv je hlasový otisk stejně unikátní jako otisk prstu, samozřejmě zfalšovat jde. Teoreticky můžu obelstít jakýkoliv systém. Ale musím vynaložit nějaké úsilí. A otázka je, jestli se mi to úsilí vyplatí a jestli mi za to stojí ten risk. Pokud bych chtěl zfalšovat něčí hlas, musel bych mít vyšší desítky až stovky hodin nahrávky daného člověka. Což už je samo o sobě velmi těžké získat,” vysvětluje Hrabí a dodává, že biometrické systémy obvykle z důvodu větší bezpečnosti kombinují více zdrojů informací. „Může to být telefonní číslo, ze kterého klient volá, lokalita nebo jednoduše heslo. I kdyby se vám tedy podařilo obelstít jednu část systému, obelstít všechny už by bylo velmi komplikované," podotýká.
Lidský hlas je u každého člověka stejně unikátní jako otisk prstu
Přesto i nabídka Phonexie na hrozby využívající falšovaného, neboli syntetizovaného hlasu reaguje. Detekce syntetického hlasu bude například brzy součástí řešení Phonexia Voice Verify. To dokáže během pouhých tří vteřin potvrdit, zda opravdu volá daný člověk. „Nejprve je nutné vytvořit dvacetivteřinovou nahrávku, které říkáme hlasový otisk. Hlasový otisk je možné získat například při zřizování bankovního účtu nebo při podpisu pracovní smlouvy. Otisk se uloží do databáze a následně už stačí pouhé tři sekundy na ověření identity volajícího,” popisuje fungování technologie Hrabí.
Výhodou nástroje od Phonexie je podle něj i to, že je založený na rozpoznávání unikátních charakteristik hlasu. Je tedy jedno, zda na něj člověk promluví jednou česky a jednou anglicky a nemusí ani používat konkrétní fráze či opakovat při každém volání stejné heslo. Ověření probíhá „na pozadí“ a telefonní rozhovor to nijak neruší.
Budoucnost patří hlasovým rozhraním a rychlým dodávkám zboží
Při otázce na odvětví, kam ještě plánuje Phonexia proniknout, si Michal Hrabí povzdechne. „Máme před sebou tolik směrů, kterými by bylo možné se vydat. Musíme proto zvažovat, který z nich bude dávat ten největší smysl,” říká. Jedna z oblastí, na kterou se ale nyní firma plánuje soustředit, jsou technologie pro hlasová rozhraní. „Postupně poroste ochota je akceptovat. V Americe už se to děje, v Česku zatím ne, protože sem ještě firmy neinvestují. Velmi reálný příklad z budoucnosti ale je, že člověk při grilování zjistí, že mu chybí ubrousky, pomocí chytrých hodinek nebo třeba Alexy si je přes hlasové rozhraní objedná a za deset minut mu na zahradě přistane dron nebo je doveze kurýr. Právě díky napojení na hlas bude potvrzena i bankovní transakce a peníze za ubrousky se rovnou strhnou z karty,” přibližuje možný scénář Hrabí. Velkou budoucnost tedy vidí právě v automatizovaných dodávkových službách v kombinaci s jednoduchým uživatelským rozhraním. „A to je rozhraní hlasové, protože je to pro člověka nejpřirozenější. Člověk i na zařízení bude raději mluvit, než aby příkazy psal,” dodává.
Partnerům, kteří tyto systémy budou vyvíjet, pak Phonexia plánuje nabídnout nástroje na ověřování transakcí nebo technologie pro interakci zařízení s člověkem. „Je to trh, který roste meziročně o více než dvacet procent, a my jsme rádi, že už za sebou máme množství odvedené práce a patříme mezi technologické špičky, takže cítíme, že jsme ve správný čas na správném místě,” uzavírá Hrabí.
Foto: archiv Phonexia