Představte si, že posloucháte cvrlikání ptáků, vytáhnete telefon a dešifrujete, co si navzájem říkají. Nebo vyrazíte na safari v Africe a vyposlechnete si, o čem si povídají dva sloni. Zdá se vám to přitažené za vlasy? Vývoj strojového učení ukazuje, že něco takového není až tak nemyslitelné. Nezisková organizace Earth Species Project (ESP) chce pomocí umělé inteligence nejen dekódovat zvířecí řeč, ale také se zvířaty začít komunikovat.
Naši planetu sdílí více než 8 milionů druhů, a přitom rozumíme jen jazyku jednoho. I přes stovky let soužití se zvířaty stále zachytáváme jen zlomek toho, „co říkají“. Umělá inteligence nám však odemyká kdejaké nové možnosti. Bude i vstupenkou do říše zvířat? Jsme na správné cestě k tomu, abychom mohli rozhovory zvířat odposlouchávat, nebo se jich dokonce účastnit?
Vědci proto chtějí využít strojového učení k vytvoření programu, který dokáže dešifrovat všechny formy zvířecí komunikace. Organizaci Earth Species Project (ESP), která se tohoto úkolu zhostila, založili Aza Raskin (spoluzakladatel Mozilla Labs) a Britt Selvitelle (člen zakládajícího týmu Twitteru).
Pro dosažení cílů organizace je nezbytná úzká spolupráce mezi vývojáři a odborníky na chování zvířat. „Rád srovnávám umělou inteligenci s vynálezem dalekohledu, díky kterému jsme si uvědomili, že Země není středobod všeho. S tímto nástrojem zase zjistíme, že lidstvo není na naší planetě centrem veškerého dění,“ uvedl Aza Raskin.
Svět neviditelných informací
Když se procházíme venku, prakticky plaveme v moři informací a signálů od jiných druhů. Mnohé z nich jsou pro nás nepostřehnutelné. Například když sedíme na lavičce v parku, jsme obklopeni zpěvem ptáků nebo hmyzími feromony, které ale sotva vnímáme. Tím, že ostatní druhy jsou „utlumené“, můžeme koexistovat ve stejném fyzickém prostoru a nenarušovat konverzace ostatních. Podle biologů je to, jako by každý druh měl svou vlastní „rozhlasovou stanici“, kde může vysílat s malým rušením z jiných kanálů. Odstranění hluku v pozadí má z evolučního hlediska význam, umožňuje nám soustředit se na věci, které jsou zásadní pro naše přežití.
Většina našeho současného chápání zvířecí komunikace pochází z desítek let pečlivých měření a pozorování biologů. Proces interpretace signálů však může trvat. Vždyť včely jsou tu s námi od nepaměti a účel včelího tance přitom popsal až rakouský etolog Karl von Frisch v počátcích 20. století. I když tedy vnímáme zvířecí signály, obvykle nedokážeme rozeznat význam, který je v nich uložen. Většina z nás by třeba jen těžko našla opakující se vzory ve velrybím zpěvu.
Naštěstí máme po ruce umělou inteligenci, a ta je v rozpoznávání vzorů velmi dobrá. Mnoho algoritmů strojového učení dělá přesně toto: nacházejí těžko rozpoznatelné vzory a signály v obrovském množství šumu. A přesně toho chce ESP využít. Není to nemožné, jednoduché však také ne.
Digitální Doktor Dolittle
Velká část výzkumu je založena na velkých jazykových modelech, které jsou podobné těm, které používají ChatGPT nebo Google Bard. Tyto modely se učí na obrovském množství dat, aby pochopily vztahy a souvislosti mezi slovy a jejich významy. Kde je ale v tomto případě vzít?
Největším problémem, kterému tak vědci ve svém úsilí o dešifrování zvířecí komunikace čelí, je nedostatek základních dat pro trénování jazykových modelů. ESP se proto aktuálně snaží shromáždit co nejvíce dat od divokých zvířat i zvířat chovaných v zajetí z celého světa, a vývojáři pak tato audio a video data nahrávají do databáze spolu s komentářem od biologů. Data z nesčetných zdrojů lze poté spojit a analyzovat pomocí nástrojů umělé inteligence, a rozluštit význam různých způsobů chování a komunikačních forem zvířat.
Spoluzakladatel ESP Aza Raskin věří, že první výsledky budou znát za 12 až 36 měsíců. O pokrocích výzkumu organizace průběžně informuje na svých oficiálních stránkách i sociálních sítích. První vlaštovky se nicméně objevují již teď.
Fenomén koktejlového večírku
Na přeplněném večírku nebo v hlučné restauraci většina z nás udělá něco pozoruhodného. Ze všech zvuků a hlasů kolem nás dokážeme poslouchat jen jednoho konkrétního člověka ve skupině a ostatní ignorovat. V roce 1953 britský vědec Colin Cherry nazval tento fenomén „problémem koktejlové párty“ a od té doby je předmětem studia v oblasti psychologie, neurověd, informatiky i biologie.
V praxi byl problém koktejlového večírku dlouho hlavní překážkou ve studiu přírody, protože u nahrávek zvířat byli biologové vzhledem k obtížnosti separace zdrojů zvuku často nuceni vyřadit velké množství dat s překrývajícími se vokalizacemi. Minulý rok výzkumníci z ESP představili ve vědeckém magazínu Scientific reports své řešení BioCPPNet. Podobně jako software pro rozpoznávání hlasu je algoritmus schopen izolovat jeden jedinečný zvuk ze záznamu více vybraných druhů zvířat. I to je krokem vpřed k okamžiku, kdy rozkódujeme řeč zvířat.
Přispěje naslouchání zvířatům k řešení globální výzev?
Porozumět nejniternějším myšlenkám svého psa by každý z nás jistě ocenil. Ale výhody porozumění zvířatům jdou daleko nad rámec naslouchání rozhovoru o tom, co si váš mazlíček během venčení povídá se svými psími kamarády. Technologie má podle organizace potenciál změnit naše chápání světa a to, jak nahlížíme na přírodu. Schopnost dešifrovat komunikaci zvířat by mohla mít přímé důsledky pro zachování a ochranu naší planety. Vědci by přesněji věděli nejen, jak zvířata v rámci svého druhu komunikují, ale také jak loví, jedí, rozvíjejí vztahy mezi sebou nebo jak vidí a zpracovávají svět kolem sebe.
A pochopit to, co si zvířata myslí a říkají, je podle organizace prvním krokem k tomu, abychom dali ostatním druhům na planetě „hlas“ v diskusi o našem životním prostředí. Měly by být například velryby požádány, aby uhnuly z cesty lodím, když to zásadně změní jejich způsob života, nebo by lodě měly změnit kurz?Odpověď tu může být dříve, než si myslíme.