Tři středoškolské studenty svedl dohromady zájem o umělou inteligenci a společně přišli s vizí, jak ji využít v boji proti dezinformacím. Výsledkem je aplikace Verifee, kterou Matyáš Boháček, Michal Bravanský a Filip Trhlík momentálně vyvíjí pod střechou O2 v úzké spolupráci s Janem Romportlem (na úvodní fotografii vpravo), ředitelem centra Dataclair.ai. Nový přístup k analýze důvěryhodnosti zpráv by měl být hotový v polovině příštího roku.
Dezinformacím se v Česku daří. A v době koronavirové pandemie to platí víc než kdy dřív. Naštěstí se ale daří také projektům, které proti tzv. fake news bojují všemi možnými způsoby. Jednou z nadějných iniciativ, která by mohla z dlouhodobého hlediska přispět ke kultivaci žurnalistiky a zvýšení mediální gramotnosti, je Verifee. Nově vznikající aplikaci mají na svědomí tři studenti a kamarádi. Fungovat bude na bázi umělé inteligence, která dokáže na základě desítek parametrů vyhodnotit důvěryhodnost zpravodajských článků, přidělit jim skóre a zároveň výsledné hodnocení jasně odůvodnit.
Matyáš Boháček, Michal Bravanský a Filip Trhlík se poprvé potkali minulý rok na třetím ročníku akce 20 pod 20. Výběr týdeníku Euro zahrnuje mladé talenty, kteří mají ambici měnit Česko, potažmo svět k lepšímu. Podruhé se jejich cesty střetly v soutěži Středoškolák roku. To už bylo jasné, že sdílí nejen zájem o umělou inteligenci, ale také obavy z náchylnosti české společnosti nechat se ovlivnit dezinformacemi.
„Každý máme osobní zkušenost z blízkého okolí. Často se jedná o lidi, kterých si vážíme, například babička nebo profesorka. Zároveň jsme už za sebou měli projekty týkající se zpravodajství, takže naše směřování bylo celkem jasné,” vysvětluje Boháček, který aktuálně studuje předposlední ročník na pražském Gymnáziu Jana Keplera a před třemi lety vyvinul aplikaci Newskit, jež shromažďuje důvěryhodná česká média. Také Bravanský se v minulosti novinařinou zabýval a vytvořil agregátor zpráv Měj přehled. Příští rok ho čeká maturita na Gymnáziu Mikuláše Koperníka v Bílovci. Nejstarší z trojice Filip Trhlík momentálně studuje University College London a na kontě má projekt Boxee, chytré schránky pro výdej balíčků z Přerova.
Předstupněm vzniku samotného Verifee byla účast v soutěži Robothon letos v lednu. 36 hodinový hackaton se uskutečnil k 100. výročí uvedení divadelní hry Karla Čapka R.U.R. Účastníci mohli zvolit jednu z osmi oblastí a vymyslet řešení za pomoci umělé inteligence. „Přirozeně jsme si vybrali výzvu Fake news a generování textu. Záhy vykrystalizoval nápad na vyvinutí modelu, který bude skrze určité parametry detekovat manipulativní články a bude schopný transparentně říct, co mu na nich vadí. Udělali jsme základní demo a Robothon jsme ještě pod názvem AI.Why? vyhráli,“ popisuje Boháček.
Startup uvnitř korporátu
Jedním z mentorů a porotců byl Jan Romportl, ředitel Centra pro umělou inteligenci ve společnosti O2 Czech Republica, které buduje pod brandem Dataclair.ai. Právě on výherce po skončení akce oslovil a nabídl jim spolupráci. „Výherní cena byla 50 tisíc a my jsme stáli před rozhodnutím, jestli založit vlastní startup. Podporu nám nabídlo také Ministerstvo průmyslu a obchodu. Všechno to ale byly těžko udržitelné možnosti, protože na vývoj AI je potřeba hodně zdrojů, navíc chceme vytvořit něco, co bude mít reálný dopad,“ vysvětluje Trhlík. „Nakonec jsme si zvolili cestu inkubace, jako neziskový projekt O2, abychom se mohli plně soustředit na vývoj a výzkum a nemuseli řešit provozní věci. Máme extrémní autonomii. Nejvýstižnější mi přijde, že vyvíjíme startup pod korporátem,“ dodává s tím, že stěžejní je nabídnout výsledný produkt uživatelům zdarma. „Honza Romportl je v podstatě čtvrtý člen týmu, strašně nám pomáhá a je to skvělý mentor,“ doplňuje pozitivní zkušenost Boháček.
„Jedná se o jednu ze společensky nejdůležitějších věcí, které nyní pomocí umělé inteligence můžeme dělat, proto projektu dáváme tolik energie. Spolupráce s kluky je výborná. Jsou to jedni z nejlepších data scientistů, které jsem kdy potkal, a zároveň mají výborný podnikatelský mindset a k tomu spoustu odvahy, dokonce i v rovině občanské zodpovědnosti,“ hodnotí spolupráci samotný Romportl, který v týmu zastává především roli mentora a senior advisora. Dataclair.ai Verifee poskytuje veškeré finanční, odborné a technické zázemí. „To mimo jiné znamená, že pracují na naší cloudové platformě Azure a zároveň mají přístup ke všem našim odborníkům na AI. Vážím si také toho, že i díky tomuto projektu se nám daří klukům pomoci v tom, aby se dostali na nejprestižnější světové univerzity v Anglii a USA,“ dodává.
Zleva: Matyáš Boháček, Michal Bravanský, Filip Trhlík
V rámci společensky odpovědných aktivit se O2 v posledních letech věnuje mediální výchově systematicky. V roce 2018 například spustila Nadace O2 program Chytrá škola, který si klade za cíl naučit děti, rodiče a učitele bezpečnosti na internetu, počítačovou a mediální gramotnost nebo orientaci v technologiích. Letos O2 ve spolupráci s Pedagogickou fakultou Univerzity Palackého v Olomouci a Centrem PRVoK uskutečnily unikátní výzkum Český učitel ve světě médií se záměrem zjistit, jak se učitelé základních a středních škol staví k mediální výchově nebo z jakých informačních zdrojů čerpají pro výuku. Z výsledků například vyplynulo, že polovina pedagogů neučí mediální výchovu vůbec a ta druhá polovina jen průřezově v ostatních předmětech.
„Aktuální události jako pandemie, očkování nebo předvolební období jsou využívány k dezinformačním kampaním. Mediální výchova by měla patřit mezi zásadní a základní výukové oblasti. Je potřeba se naučit ve světě médií a informací orientovat, dnes už nestačí pouze naučit se číst. Pokud škola učí děti číst, je přirozené, že by jim měla pomoci také naučit se číst kvalitně a odpovědně. A přesně o to se v O2 Chytré škole snažíme, posouvat české školy do 21. století,“ uvádí CSR manažerka O2 Marie Mališková. Školám i veřejnosti nabízí konkrétní nástroje, jako je třeba edukativní karetní hra Nekrm kachnu od organizace Fakescape nebo v příštím roce právě Verifee. „Spolupráce s Nadací O2 a O2 Chytrou školou je zásadní, protože umožní zpřístupnění hotového nástroje Verifee té nejdůležitější cílové skupině – žákům a učitelům,“ dodává Romportl.
Tým Verifee vývoj konzultuje mimo jiné také s novináři a profesory. Jedním z nich je Václav Moravec, který působí na Fakultě sociálních věd Univerzity Karlovy a stojí za platformou Infomore, interdisciplinárním projektem, jež propojuje žurnalistiku, lékařské a počítačové vědy za účelem boje proti dezinformacím týkajících se (nejen) covidu-19. Moravec se podílí také na vývoji nástroje na tzv. fact-checking, na kterém pracuje Centrum umělé inteligence Fakulty elektrotechnické na ČVUT v čele s Janem Drchalem. „S Drchalovým týmem jsme propojeni a pomáháme si s daty, ale sami jdeme jinou cestou. Jejich nástroj je užitečný zejména pro novinářskou praxi, pro rychlé ověřování faktů, zatímco naše aplikace je pro kohokoliv, kdo čte zprávy a potřebuje si zlepšit mediální gramotnost,“ konstatuje Boháček.
Jak to celé funguje?
Finální nástroj bude fungovat jako add-on (doplněk) implementovaný do prohlížeče. V okamžiku, kdy uživatel na počítači nebo telefonu najede na článek, např. při scrollování na Facebooku, aplikace ho zanalyzuje a rovnou zobrazí skóre důvěryhodnosti od 1 do 100, čímž daný text spadne do jedné ze čtyř kategorií: manipulativní, zavádějící, částečně důvěryhodný a důvěryhodný. V případě zavádějícího či manipulativního obsahu bude kolečko s číslem svítit červeně. Add-on zároveň poskytne jasný výčet problematických aspektů.
„Rozhodně nechceme nijak omezovat obsah nebo vyloženě odrazovat od přečtení konkrétních, byť problematických. Jde nám o to, že když se čtenáři objeví výstražné znamení, červená kontrolka, přistoupí k článku víc kriticky, budou ho konfrontovat, pozastaví se nad tím, jestli to, co přečetli, je pravda,“ vysvětluje hlavní myšlenku Bravanský a dodává, že jako další funkcionalitu chtějí nabídnout doporučování článků na stejné téma z alternativních zdrojů s vyšším skóre důvěryhodnosti.
Posuzovaných parametrů je několik desítek. Mladí vývojáři zmiňují například clickbaitové titulky, nestandardní slova, vulgarismy, gramatické chyby, absenci autora, netradiční interpunkci či politický extremismus a zdůrazňují, že Verifee nehodnotí obsah, ale styl, jakým je článek napsaný. „Náš model AI vezme tato kritéria, spojí je dohromady a vytvoří matematickou reprezentaci článku, kterou potom zasadí do nějaké své mapy a podle ní určí důvěryhodnost. Je důležité zdůraznit, že nejsou lineární, záleží na všech parametrech, a jak na sobě vzájemně souvisí,“ vysvětluje Trhlík, jak nástroj funguje. „Tyto spojitosti a jednotlivé napojení parametrů si určuje umělá inteligence, to není něco, co bychom do ní implementovali,“ doplňuje ho Boháček.
S klasifikací článků pomáhají studenti žurnalistiky z Fakulty sociálních věd. „Vzali jsme několik tisíc zpravodajských článků, studenti k nim na základě detailně propracované metodiky přiřazovali jednotlivé kategorie důvěryhodnosti. Na těchto datech potom učíme AI dělat souvislosti mezi jednotlivými parametry,“ popisuje Bravanský. „Data, která studenti anotovali, jsou velmi diverzifikovaná tak, aby byl model při učení exponován co nejširší škále zpravodajství. Když to řeknu zjednodušeně – jedná se o matematickou neuronovou síť, do ní vstupují matematické reprezentace a ta síť na trénovacím data setu upravuje váhy, které přikládá různým vlastnostem nebo kombinacím. V podstatě zobecní to, co se naučila na vzorku a do budoucna to přenese na další data, tedy články,” přibližuje koncept strojového učení Boháček.
Zprávy jsou data, která tečou
Vývoj začal v březnu a první výsledky by měly být koncovému uživateli předloženy zhruba v polovině roku 2022. Co se týče konkrétních termínů, je trojice ale raději opatrná. „S projektem tohoto typu existuje jen jedna šance jít s ním na veřejnost. Nechceme ztratit kredibilitu, takže než s aplikací půjdeme ven, chceme si být stoprocentně jistí, že je dotažená. I kdyby to mělo znamenat, že se zpozdí,“ uvádí Bravanský. Zatímco back-end a model umělé inteligence jsou už z velké části dokončené, uživatelské rozhraní je teprve v počáteční fázi.
V první fázi fungování se Verifee zaměří na běžné konzumenty zpravodajských obsahů skrze zákaznickou základnu O2. Časem podle Trhlíka ale nevylučují ani B2B segment: „Jsme teprve na začátku, ale určitě nám to do budoucna dává smysl. Vnímáme čím dál větší legislativní tlak ze strany EU zaměřený na boj s dezinformacemi a s tím vzniká poptávka různých serverů nebo agregátorů po podobném nástroji. Spíš než služba bychom chtěli být jejich partner.“ To potvrzuje také Jan Romportl: „Chceme dosáhnout, aby uživatelé brali aplikaci jako pomocníka, nikoliv jako nepřítele. Verifee nerozhoduje o tom, co je pravda, má lidem pomoci udržet si otevřenou mysl a kultivovaný dialog s okolím. Co se týče ambicí do budoucna, chceme dostat Verifee jako plugin do webového prohlížeče každého uživatele českého internetu,“ říká.
Potenciál vidí zakladatelé i ve větším zapojení umělé inteligence v žurnalistice obecně. „Zprávy jsou ve své podstatě data, která někam tečou, a vytváříme jich čím dál víc. AI ve svém nejzákladnějším formátu je jenom zpracování dat. Takže je naprosto logické ji do novinařiny nějakým způsobem zapojit. Může výborně sloužit k tomu, aby nás zbavila rutinní práce. Winstonovi Churchillovi dva lidé kontrolovali gramatiku jeho dopisů, dnes tohle dělá Word, i když to třeba není dokonalé. Je to drobný příklad, ale s těmito rutinními úkony nám může umělá inteligence velmi snadno začít pomáhat,“ uzavírá Filip Trhlík.
Foto: Verifee