Když v lednu bývalý premiér Andrej Babiš vystoupil před soudem v kauze Čapí hnízdo se svou závěrečnou řečí, byla obsáhlá. Její délka vedla předsedu soudního senátu Jana Šotta k tomu, že požádal strany sporu o souhlas, aby se řeč nepřepisovala do protokolu, ale založila se tam v podobě zvukového záznamu. Důvodem bylo i to, aby při specifičnosti řečníka dávala smysl. Což lépe splňoval zvuk než psaná podoba. Jde sice o nedávný případ, který se odehrál v rámci české justice, ale zvukový přepis řeči je velkým tématem celosvětově.
V souvislosti se společností OpenAI se v posledních měsících nejvíce mluví o ChatGPT, ale už loni v září představila produkt Whisper. Jde o systém automatického rozpoznávání řeči trénovaný na 680 tisíc hodinách vícejazyčných a multitaskově kontrolovaných dat shromážděných z webu. Firma na něm ukázala, že použití tak velké a různorodé datové sady vede k lepší odolnosti vůči akcentům, hluku na pozadí a technickému jazyku.
Ještě o pár let dříve se na přepis mluvené řeči s využitím možností umělé inteligence vrhnul česko-slovensko-americký startup Parrot. Své zaměření ale zúžil na oblast a teritorium, kde by využití jeho produktu mohlo byznysově nést okamžité výsledky.
Celý příběh si přečtěte ZDE.