„Vzniká unicorn firma.” Pražský Rossum digitalizoval data i při volbách v USA, zakladatel z něj chce „univerzální překladač mezi firmami”

„Vzniká unicorn firma.” Pražský Rossum digitalizoval data i při volbách v USA, zakladatel z něj chce „univerzální překladač mezi firmami”

10. úno 2021 Matyáš Vejskal 8 min

Nástroj na digitalizaci papírových dokumentů od Rossum dnes používají klienti po celém světě a firma, kterou v lednu 2017 založili tři studenti doktorského studia na ČVUT - Petr Baudiš, Tomáš Gogar a Tomáš Tunys - raketově roste. Startup od té doby prošel několika koly investic, v tom posledním seedovém od investorů jako Miton a SeedCamp vybral přes 4 miliony dolarů. S Petrem Baudišem jsme se bavili o tom, jakou revoluci Rossum nabízí, čím překvapili v průběhu amerických voleb a koho právě teď pro další rozvoj hledají do týmu.

Petře, zkuste mi laicky vysvětlit, čím se Rossum zabývá?

Rossum automatizuje obchodní komunikaci, která je založena na dokumentech. Laicky jde o to, že jakoukoliv věc teď máte u sebe - třeba tento USB flash disk - tak než se vám vůbec dostala do ruky, prošla cestou, na které se podílely klidně stovky firem. Výrobci plastů, samotná továrna nebo logistické firmy tak společně pracovali na jedné věci, ale každý u toho mluvil jiným jazykem. Co firma, to jiné informační systémy, jiné formáty dokumentů a tak dále. Tento neefektivní chaos funguje jen díky obrovskému množství lidské práce ukrytém kdesi na pozadí, kdy lidé v backoffice přeťukávají faktury a objednávky do různých systémů, řeší nejasnosti nebo chybějící údaje. A Rossum tohle všechno digitalizuje a automatizuje.

Z vaší webové stránky tuším, že ta automatizace bude založená na AI. Mám pravdu?

Máte. Naše řešení je založeno na unikátní technologii umělé inteligence, která dokáže z nestrukturalizovaných dokumentů vytahat data nehledě na jejich podobu a rozvržení. K tomu řešíme i řadu dalších věcí, abychom ušetřili čas běžně promrhaný zdlouhavým upřesňováním údajů, kdy se musí psát e-maily a zvedat telefony. Rossum má jednoduše ambici stát se univerzálním překladačem mezi firmami bez toho, aby ta domluva musela být na pozadí poháněna lidskou prací.

Váš web začíná větou: Extrahujte data z faktur rychleji než kdy dřív”. Zaměřujete se tedy především na faktury?

Faktury jsou pro nás číslo jedna, většina našich důležitých klientů jsou velké firmy, které někdy měly dvě patra plná lidí, co jim pořád dokola přeťukávali data z všemožných PDFek a papírů do formulářů ve firemním účetnictvích. A pokud nevěděli, volali odesílateli, aby mu řekli, že tam něco nesedí a v jejich systému jim to hází chybu.

Rossum má ale mnohem širší možnosti nasazení a lze ho použít na cokoliv, co vypadá podobně jako faktura - objednávky, celní prohlášení, zbožové listy atd.

A to neexistuje pro faktury nějaký xml formát, který by byl standardizovaný?

To je nápad starý už šedesát let, ale stále se to nepovedlo. Když to dnes zkusíte v praxi, zjistíte, že žádný systém neumí přečíst xmlko vygenerované jiným informačním systémem, kompatibilita nefunguje. Máme zákazníky, kteří donutili všechny dodavatele přejít na strojově čitelný formát - a nakonec 95 % zpráv renderují do PDF a vyčítají Rossumem, protože přesvědčit jejich software, aby všechny varianty XML, co dostávali, přijal, bylo nad jejich síly.

Neváhám však říct, že by mezi firmami s intenzivní dlouhodobou spoluprací xmlka běhat měla. Ale místo toho, aby se každé dvě firmy dohadovaly nad formáty dat, to bereme jako další příležitost pro nás a funkcionalitu, kterou bychom pro automatizaci mezifiremní komunikace měli nabídnout sami.

Postřehl jsem, že jste své řešení nasadili i v rámci amerických prezidentských voleb. Můžete mi převyprávět, čeho jste dosáhli?

V Americe musí každé médium posílat regulátorovi FCC, něco jako náš ČTÚ, kopie faktur, které vystavilo každému kandidátovi. Existuje tak evidence, jakou reklamu si kdo objednal u které televizní stanice, ale nad těmito fakturami neexistuje žádná analytika. Máte složku s desítkami tisíc dokumentů, ale žádnou excelovskou tabulku, kde by byly pohromadě jednotlivé částky. My jsme použili Rossum na to, aby ze všech těch dokumentů vyzobal data, a vytvořili jsme ve spolupráci s E.ventures právě tuhle tabulku.

Ukazujeme například, kolik peněz v který den na které stanici utratil daný kandidát. Poskládali jsme z toho i přehlednou mapu. To samé jsme vytvořili také pro senátní volby v Georgii, které byly pro demokraty rozhodující, protože bez většiny v senátu by jen těžko cokoliv prosazovali.


Mapa znázorňující rozložení nákladů na televizní kampaně v prezidentských volbách 2020 mezi Donalda Trumpa (červená) a Joe Bidena (modrá).

Využili jste Rossum jen na vytvoření strukturovaných dat, nebo jste se pokusili i o jejich analýzu?

Kromě základního přehledu jsme sami žádnou podrobnou analýzu nedělali, spolupracujeme na tom s americkými politology a tuto sumarizaci časem vydáme. Chtěli jsme především ukázat, jaké možnosti technologie nabízí, protože to samé se děje v USA při volbách šerifů či soudců, jenom tato data nikdo nezkoumá. S Rossumem je možné faktury prohledávat automatizovaně a odhalit zajímavé anomálie v kampaních, jako jsou faktury vystavené na nulovou částku nebo případ šerifa, který utratil na kampaň přes milion dolarů.

Jsou takovéto experimenty součástí firemní strategie?

Průběžně nám podobné pro bono projekty běží. Kromě amerických voleb tak třeba pomáháme s výzkumem změny klimatu vedeným vědci z Velké Británie, kteří analyzují historické knihy meteorologických dat a s pomocí superpočítačů vytváří podrobný model.

Opravdu inteligentní AI

Zmínil jste, že používáte unikátní technologii. Předpokládám, že jde o AI a OCR (optické rozpoznávání znaků). Jak pokročilé vaše řešení je?

Když přijde vědec do běžné firmy, tak tam obvykle vidí nějakou triviální techniku logistické regrese, v horším případě tým lidí ze zemí třetího světa, kteří to tam na pozadí dělají s vidinou toho, že za pár let to konečně převezme ta AI.

My jsme touhle cestou nešli, skutečně jsme se pustili do původního výzkumu umělé inteligence založené na deep learningu a strojovém vidění. Všichni tři zakladatelé jsme doktorandi z ČVUTu v oblasti umělé inteligence a pracovali jsme na modelech hlubokých neuronových sítí. Jednotlivé machine learning modely jsme si vyvíjeli kompletně interně, a nemusíme tak používat žádná řešení třetích stran pro OCR. Náš největší původní přínos je způsob, jakým dokumenty reprezentujeme a dokážeme identifikovat jednotlivé údaje, i když se rozložení každé stránky dramaticky liší.

Pojí se s tím nějaká omezení?

Zatím naše služba umí zpracovávat jen jazyky, které používají latinku. To je nevýhoda oproti dostupným OCR řešení, jež si poradí i s čínskými a arabskými znaky. My jsme začali od západního trhu, ale dostane se i do téhle oblasti.

Uměl byste kvantifikovat přesnost vašeho řešení?

To se dá jen těžko říct. Přesnost samozřejmě měříme, ale u každého zákazníka je ta vysněná hodnota dramaticky odlišná. U jednoho klienta máme přesnost 98,5 procenta - s tím je spokojený a cokoliv nižšího by byl problém. Druhý klient je nadšený i z 80procentní přesnosti, protože na jejich dokumentech vyšší přesnost dosáhnout jednoduše nelze. I tohle jim ale šetří extrémní množství práce. To přesně zapadá do strategie Rossumu, protože věříme v kombinaci člověka a stroje - stroj odmaká tu automatizovanou práci, ale pokud si není jistý, zeptá se člověka. Obecně ale jako úspěch bereme, když lidem ušetříme alespoň 90 % času ve srovnání s tím, kdyby to dělali ručně.

Jak ta interakce stroje s člověkem probíhá?

Máme na to intuitivní uživatelské rozhraní, na kterém jsme si dali hodně záležet. Uživatel tam prochází všechny problémy, které se nepovedlo umělé inteligenci vyřešit, čímž jí zároveň dává okamžitou zpětnou vazbu. Typicky se třeba na faktuře objeví údaj o ceně na novém místě a uživatel jedním kliknutím systému ukáže, odkud cenu správně vzít. Naším cílem je takzvaný one-shot learning, tedy aby se z této jedné zpětné vazby naše řešení dokázalo naučit novou věc a použít ji hned na příštím dokumentu bez dodatečného přetrénovávání celé neuronové sítě.


Uživatel s Rossumem pracuje skrz aplikaci, nebo vaše řešení integrujete třeba do účetních systémů?

Umíme oboje, protože každý klient má jiné představy. Jsme v tomto ohledu skutečně flexibilní, takže když k nám přijde třeba firma velikosti Siemensu a začne vyžadovat různá přizpůsobení, umíme jí vyhovět. Povedlo se nám ale nespadnout do pasti mnoha startupů, které od samých začátků svoje řešení pro každého klienta na pár místech přiohnou a ve finále tak udržují nespočet různých verzí. Tomuhle jsme se naším programátorským přístupem k otevřeným API a webhookům dokázali vyhnout. Cokoliv je potřeba, ať jsou to kontroly číselných řad nebo třeba překlady doplňujících popisů přes Google Translate, tak umíme klientovi nabídnout na míru skrz externí komponenty a bez zásahů do vlastního produktu.

Jak velký musí být váš klient, aby se mu vyplatil tuto technologii nasazovat?

Zpravidla mluvíme o klientech, kteří zpracovávají alespoň několik tisíc faktur měsíčně. Většina z nich jsou takzvané SME, tedy malé a střední podniky. Mezi zákazníky máme i řadu těch největších světových firem. Mimo náš přímý záběr jsou malé účetní firmy, těm Rossum umí doručit výrobci účetního softwaru jako například Abra Flexibee.

Kde všude už Rossum firmy používají?

Drtivá většina našich klientů je v Evropě a Severní Americe, ale uživatele Rossumu najdete od Austrálie po Jižní Ameriku.

Kolik řešení Rossum stojí?

Naše cena se odvíjí především od počtu skenovaných dokumentů, hodně zákazníků si ale dokupuje i služby navíc třeba týkající se integrací nebo zabezpečení.

Zveřejňujete tržby nebo počty prodaných licencí?

Rosteme tak rychle, že tato čísla obvykle do médií neuvádíme. Mohu ale říci, že náš růst je okolo 300 procent ročně. Nehledě na loňskou krizi v tomto tempu pokračujeme.

Koronavirus a opatření se vás tedy nedotknul?

Samozřejmě jsme se s tím museli v karlínské kanceláři, nebo spíš mimo ni, popasovat, ale byznysově nám to spíše pomohlo. Spousta klientů, se kterými jsme delší dobu jednali, dostala jasný impuls a začala seriózně digitalizovat. My jsme jim pomohli bleskově přejít z papíru na digitální řešení.

„Vzniká unicorn firma”

Jak velký je v současné době váš tým?

Je nás přes 60, kdy jedna polovina je R&D a druhá obchod a marketing. A dál rychle rosteme.

Koho hledáte?

V současné době nabízíme pestrou paletu pozic. Hledáme lidi, kteří jsou hodně akční a chtějí být u toho, když vzniká nový hyper growth startup, když vzniká unicorn firma. Jsou to jednak technické pozice, kdy hledáme hlavně zkušené programátory, které nemusí bavit jen umělá inteligence, ale i solidní návrh velkého a škálovatelného softwarového systému v Pythonu. Základ, který máme, potřebujeme předělat na o dva řády větší zátež a data, přidat hodně nových funkcí spojených hlavně s novými komunikačními protokoly a externí rozšiřitelností a pracovat na spolehlivosti a bezpečnosti, aby nám svěřil data i zbytek těch největších světových firem.

A potom samozřejmě rozšiřujeme tým obchodu a marketingu, kdy se koukáme hlavně po technicky založených kandidátech. Uplatní se u nás třeba programátoři, které zase tolik nebaví celý den vyvíjet a chtěli by se trochu posunout, například do product managementu nebo growth hackingu.

Petr Baudiš, spoluzakladatel Rossum, v současné době hledá do firmy akční, ideálně technicky založené, posily.

Funguje váš tým vzdáleně, nebo jen z pražské kanceláře?

Doteď jsme fungovali všichni v pražské kanceláři, což ale neznamená, že jsme všichni Češi. Máme v týmu už přes 20 národností a nebráníme se vlastně ani remote práci. Jsme otevřeni flexibilnímu nastavení práce z home office a plně remote spolupráci zvažujeme až teď s čistě technickými pozicemi. Rádi se ale potkáváme, takže je pro nás výhoda, když tým může být jednou za čas aspoň na pár dnů pohromadě.

Foto: archiv Rossum

Matyáš Vejskal

Další články autora →

Líbil se vám článek? Sdílejte jej!
Přečtěte si dále
Související témata: Osobnosti, Aplikace, Startupy, Technologie
Nenechte si uplavat nové články!
Váš e-mail
Sledujte nás:
Další články