Konverzační umělá inteligence se v posledních měsících rozšiřuje po celém Česku. Společnosti spouštějí nové virtuální asistenty, hlasové ovládání se zdokonaluje v autech i chytrých domácnostech. Má to ale jeden háček, hlasy umělé inteligence jsou si velmi podobné nebo dokonce stejné. A tak se stává, že s financemi vám radí ten samý hlas, který vám jinde vydává balíky. A navíc neumí pořádně intonovat. To chce změnit česká technologická společnost Agnostix, která začala vytvářet pro umělou inteligenci originální české hlasy na zakázku.
Většina hlasových rozhraní používá běžně dostupné služby velkých dodavatelů, kteří však nabízejí omezenou paletu možností. „Dřív to tak nevadilo, ale s rozšiřováním hlasových rozhraní se podobnost hlasů ukazuje jako čím dál tím větší problém. Hlas voicebota nebo virtuálního asistenta se stává součástí identity společnosti. A rozhodně nechcete, aby zněl stejně jako vysavač nebo jako reklama na stránkách pro dospělé,“ vysvětluje Martin Franc, spoluzakladatel společnosti Agnostix, která se specializuje na vývoj a implementaci virtuálních asistentů.
Kouzlo nového přístupu, který Agnostix přináší, je možnost připravit model, který bude mluvit přesně takovým hlasem, který si firma nebo organizace určí. Může jít o celebritu, herce, dabéra nebo šikovného zaměstnance firmy, se kterým se uzavře smlouva. Nemá-li firma nikoho takového, Agnostix může sám zajistit hlas podle představy klienta. Jak to funguje? Hlas je na začátku profesionálně nahrán na předem připravené trénovací sadě vět. Nahrávání musí přitom probíhat ve speciálním studiu. „Abychom mohli vlastní hlasy nahrávat, museli jsme projít etickou komisí Microsoftu, který má zároveň určené metriky hodnotící kvalitu nahrávacího studia,“ říká Mário Mitas, spoluzakladatel Agnostix.
Po nahrání hlasu se trénuje model, který je pak propojen s asistentem nebo voicebotem. Hlas, který Agnostix vytváří, je čistě generovaný a je schopen říkat přesně to, co dostane zadáno. Nic není potřeba dotáčet. „Díky tomuto přístupu a práci našich expertů na jazyk i umělou inteligenci je tvorba hlasu mnohem efektivnější a výsledný hlas působí mnohem přirozeněji, lépe pracuje s intonací a nezní tak strojově a studeně, jak lze dnes slyšet ze všech stran,“ popisuje Martin Franc. Výsledný voicebot nebo virtuální asistent se díky tomu stane součástí identity firmy nebo organizace a zákazníci ji poznají i po hlase.