Startup ElevenLabs, zabývající se výzkumem hlasových technologií a světový lídr v oblasti audio softwaru s využitím umělé inteligence, vybral v Series A 19 milionů dolarů. Prostředky jsou určeny na další výzkum a vývoj a také na spouštění dalších produktů. Aktuálně navíc společnost na trh vysílá inovace, které umožňují komukoliv vytvořit na platformě během několika minut celou audioknihu. Novinkou je rovněž model detekce řeči pomocí umělé inteligence.
Společnost ElevenLabs představila svou beta platformu v lednu 2023 poté, co rok 2022 věnovala vývoji zvukových modelů umělé inteligence, které by mohly vytvářet nejvšestrannější a kontextově nejcitlivější hlasy AI. Za necelý půlrok od spuštění ElevenLabs získal více než milion registrovaných uživatelů.
Těžké váhy a známá jména
Společně se spuštěním nových produktů společnost také oznámila, že v investičním kole Series A vybrala od investorů částku 19 milionů dolarů. Kolo společně vedli bývalý ředitel GitHubu Nat Friedman, investor Daniel Gross, který v začátcích podpořil například Uber nebo Coinbase a fond Andreessen Horowitz. Zúčastnili se ho také čeští investoři z Credo Ventures, Concept Ventures a řada andělských investorů včetně co-founderů Instagramu Mika Kriegera, Oculus VR Brendana Iribeho nebo zakladatel Vercelu Guillermo Rauch.
Získané prostředky chtějí zakladatelé ElevenLabs použít na pokračování budování špičkového výzkumného centra ElevenLabs pro Voice AI a na uvedení řady dalších produktů na podporu specifických tržních vertikál, jako je publikování, hraní her, zábava a konverzační aplikace.
„Během posledních pěti měsíců jsme viděli, jak naši technologii přijaly miliony tvůrců, společností a zvídavých lidí. Jsme na začátku cesty a nyní, když se připojili Nat, Daniel a Andreessen Horowitz, máme ty nejlepší partnery, s nimiž pokračujeme na ambiciózní cestě vpřed,“ konstatoval CEO a spoluzakladatel ElevenLabs Mati Staniszewski.
Hry, audioknihy i nevidomí
Nástroje ElevenLabs dokážou převést jakýkoliv text na řeč pomocí syntetických hlasů, klonovaných hlasů nebo vytvořením zcela nových umělých hlasů, které lze upravit podle pohlaví, věku nebo preferovaného přízvuku. Společnost dosáhla nové úrovně kvality řeči, která je téměř k nerozeznání od skutečného člověka.
Platformu už využívají tvůrci v nejrůznějších oblastech, ať jde o autory audioknih, vývojáře, kteří potřebují hlasy pro své postavy ve videohrách nebo zrakově postižení při svém přístupu k online psanému obsahu. Startup ElevenLabs také zahájil řadu B2B partnerství, včetně jednoho z největších světových vydavatelů audioknih Storytel, přední globální platformy pro tvorbu obsahu TheSoul Publishing, s herními vývojáři, jako jsou Embark Studios a Paradox Interactive, nebo s kreativní mediální platformou MNTN.
„Od svého založení v dubnu 2022 jsme se zaměřili na sestavení skvělého týmu – jeden z klíčových faktorů dlouhodobého úspěchu – a vybudovali jsme jedinečný tým talentovaných, zapálených a tvrdě pracujících lidí. S tak úžasnou partou kolegů a partnerů jsme na dobré cestě k realizaci naší ambice zcela prolomit jazykové bariéry pomocí technologie,“ myslí si CTO a co-founder ElevenLabs Piotr Dabkowski.
V reakci na poptávku uživatelů ElevenLabs také oznámil Projects, produkční pracovní nástroj pro úpravy a vytváření dynamického, dlouhého mluveného obsahu. Projects poskytnou tvůrcům obsahu přístup k dosud nedostupné úrovni kontroly nad jejich zvukovým obsahem generovaným umělou inteligencí. Staví na výzkumu společnosti v oblasti spojení dlouho trvající řeči a „vyplňování zvuku“, díky čemuž mohou uživatelé nově bez problému vytvářet celé bloky dialogů, zpravodajské články nebo dokonce audioknihy, aniž by přitom opustili platformu. Projects si kladou za cíl poskytovat jednoduchost a uživatelskou přívětivost při vytváření zvuku na úrovni Google Docs.
Dabing ještě letos
Projects se připojují k dalším produktům z dílny ElevenLabs zahrnující Speech Synthesis, platformu pro převod textu na řeč, která využívá už existující syntetické hlasy, a VoiceLab, pracovní postup pro vytvoření jedinečného hlasu nebo digitální verze stávajícího hlasu. Platforma také nedávno uvolnila přístup k Eleven Multilingual, modelu syntézy řeči, který lze použít ve všech hlavních evropských jazycích.
Tyto vývojářské pokroky mají být odrazovým můstkem k vývoji nástroje AI dabingu, který by měl být vydán koncem tohoto roku. Měl by umožnit zkopírovat jakékoliv video do jakéhokoli jazyka při zachování hlasu původního mluvčího. Společnost už provádí řadu testů s průmyslovými partnery, aby umožnila AI dabing ve velkém měřítku.
K dalším aktuálně odhaleným novinkám patří klasifikátor řeči umělé inteligence. Tento nástroj má komukoliv umožnit nahrát zvukovou ukázku a zjistit, zda klip obsahuje zvuk generovaný umělou inteligencí vytvořenou nástroji ElevenLabs. Tento produkt je první svého druhu v generativním audio prostoru. Je k dispozici veřejnosti a vybraným partnerům jako API.
„Naším posláním je být dokonalým nástrojem pro vyprávění příběhů, odstraňování jazykových bariér a bezpečné a zodpovědné uvedení všech publik do dosahu všech tvůrců obsahu. Díky neuvěřitelnému rostoucímu týmu a těmto výjimečným investorům je nyní ElevenLabs stále blíže realizaci svého dlouhodobého cíle učinit veškerý obsah univerzálně dostupným v jakémkoli jazyce a jakýmkoli hlasem,“ uvedl Staniszewski.
Společnost založil se svým kamarádem Dabkowskim proto, že si z dětství pamatovali, jak jim vadil špatný polský dabing amerických filmů, na které se doma v Polsku dívali. Proto se pustili do vytvoření platformy, která by jazykové bariéry spojené s nejrůznějším obsahem odstranila.
PŘEČTĚTE SI: ElevenLabs mají na nástroje pro syntézu řeči další dva miliony dolarů. Nejvíce přispělo Credo Ventures