Česko-americký startup SpaceKnow založili v roce 2013 Pavel Machálek a Jerry Javornický v San Franciscu. Během deseti let z firmy udělali jednoho z lídrů v oblasti satelitní analytiky, přestěhovali se do New Yorku, založili pobočku v Praze, nabrali přes padesátku zaměstnanců a začali si sami vytvářet trh pro inovativní řešení. V technologickém podcastu SCRIPTease o jejich cestě hovořil Michal Reinštein, který v roce 2015 nastoupil na pozici Chief Scientist (vedoucí výzkumu) a významnou měrou přispěl k tomu, že SpaceKnow dnes umí automatizovaně rozpoznat stovky různých objektů a nabídnout desítky ekonomicky zajímavých případů užití.
Článek vznikl v rámci spolupráce StartupJobs Newsroom a podcastu SCRIPTease. Celou epizodu si můžete poslechnout zde:
„SpaceKnow je firma, která se zabývá automatizovanou analytikou satelitních snímků. Ty stahujeme přes API od poskytovatelů, zpracováváme je a snažíme se z nich vytáhnout užitečné informace pomocí algoritmů počítačového vidění a hlubokých neuronových sítí,“ rekapituluje to nejdůležitější v rámci úvodního představení Michal Reinštein. Mezi dodavatele snímků patří například firmy Airbus, DigitalGlobe a Planet, ale také americká agentura NASA a evropská ESA.
„Naše zákazníky sice konkrétně jmenovat nemohu, ale jde o firmy z žebříčku Fortune 500. Máme různé typy klientů, což souvisí s tím, že máme i různé typy satelitních snímků. Můžeme se dívat kdykoliv a kamkoliv,“ popisuje. Upozorňuje však, že příčinou samotné existence a později úspěchu firmy je zejména horší kvalita snímkování v oblastech mimo euroatlantický svět, avšak zároveň s vysokým ekonomickým potenciálem. Právě tuto díru na trhu umí SpaceKnow automatizovaným zpracováním dat z celé planety vyplnit.
Reinštein vysvětluje, že zákazníky lze rozdělit do tří základních skupin, které odpovídají i třem produktovým vertikálám SpaceKnow. „Tou první jsou ekonomické indexy a produkty a předpovídání ekonomického vývoje – trhů, průmyslu a podobně. Našimi zákazníky v této oblasti jsou banky, investiční skupiny či hedgeové fondy. Druhou skupinou je obranný průmysl a zpravodajství. Pro tyto klienty jsou nejzajímavější snímky s nejvyšším rozlišením. A do třetice je to analytika na zakázku, což je třeba monitoring deforestace či průmyslové aktivity v dolech. V rámci této poslední vertikály děláme i výzkumné projekty, například od Evropské kosmické agentury,“ dodává.
Satelit, který je ve skutečnosti letadlo
„To, co běžný uživatel může vidět na Mapách Google, nejsou satelitní, ale letecké snímky, pořízené třeba jednou ročně v okamžiku, kdy je krásné počasí a všechno skvěle funguje. Jejich rozlišení je mezi 5 až 10 centimetry na pixel. Nejlepší satelitní snímky, které je možné legálně koupit, mají ale rozlišení 30 centimetrů na pixel,“ popisuje Reinštein. Rozpoznávací možnosti v takových datech jsou limitované, což je dáno mimo jiné legislativními požadavky a atmosférickými omezeními. Jejich zásadní výhodou je však aktuálnost. „Při monitoringu dané oblasti zpracováváme všechny snímky a vytváříme časovou řadu, ze které je možné vyčíst, co se v konkrétní lokalitě děje,“ doplňuje Reinštein přínos firmy SpaceKnow, kterým je poskytnutí informace o vývoji v čase.
A ještě jeden rozdíl je pro komerční využití naprosto zásadní. „Běžné letecké snímky jsou fotky, obrázky, mají pouze RGB kanály (viditelné spektrum světla – pozn. redakce). Satelitní data ale pokrývají více kanálů spektra, od infračervených po termální data. Například multispektrální satelity ESA Sentinel-2 mají 12 kanálů, a existují i hyperspektrální satelity, které opravdu pokrývají až stovky různých kanálů, což následně vyžaduje zcela odlišný způsob zpracování dat. To už se těžko představuje,“ usmívá se Reinštein a upozorňuje, že jde vždy o kompromis. Satelity se širokou spektrální škálou mají totiž rozlišení až 10 metrů na jeden pixel. Běžný rodinný dům se tedy uživateli zobrazí na monitoru jako jeden jediný obrazový bod, a to navíc pouze v případě, že se zrovna dobře trefí do snímkovací mřížky. „Z takových obrázků ale stále dokážeme provádět sémantickou segmentaci, tedy rozlišovat, kde jsou domy, silnice nebo stromy, nebo například materiály – hroudy uhlí, železa a podobně,“ popisuje Reinštein.
Při nacenění prý obecně platí, že čím vyšší je rozlišení a aktuálnost snímků, tím vyšší je také cena, ovšem i toto pravidlo má své výjimky. „Například data ze zmiňovaných satelitů Sentinel-2 jsou k dispozici komukoliv zdarma,“ láká další vesmírné badatele z řad veřejnosti. „Zklamu ale všechny fanoušky sci-fi filmů, ve kterých si někdo vyžádá satelitní snímek, přiblíží si ho a v odlesku zrcátka auta je vidět pachatel. Tak to bohužel není. Satelity Sentinel-2 prolétají nad Evropou jednou za 3 až 6 dní, nad Asií nebo Amerikou třeba jednou za 12 dní. Komerční data lze získat jednou až třikrát denně.“
Lodě, které oficiálně neexistují
Dostáváme se tak k jádru přidané hodnoty firmy SpaceKnow, tedy samotnému zpracování snímků na zakázku. To probíhá ve dvou hlavních režimech. Takzvané supervizované algoritmy se spoléhají na práci výzkumných týmů a anotování datasetů, které probíhá pomocí metod strojového učení a sémantické segmentace. Software tak dokáže od sebe rozpoznat například jednotlivé typy letadel nebo pozemní techniky. „Běžného člověka asi nezajímají nějaká auta na parkovišti. Ovšem vytíženost zaměstnaneckých parkovišť u konkrétních fabrik v Číně nám může dát pravdivou zprávu o tom, zda tamější průmysl funguje, nebo nikoliv. Tato informace se může objevit v novinách, ale my ji umíme potvrdit či vyvrátit,“ vysvětluje Reinštein a dodává, že je možné sledovat ze satelitu celý dodavatelský řetězec, například překladiště kontejnerů a lodě v přístavištích.
SpaceKnow využívá ve svých produktech následující technologie:
Python, TensorFlow, Kubernetes, Google Cloud, TypeScript
Na agregovaná data lze aplikovat prediktivní modely a odhadnout tak kupříkladu pohyby akciového trhu pro dané odvětví. Velký zájem je také o tzv. „dark ships“, tedy lodě, které v rozporu s námořní legislativou mají vypnutý odpovídací maják. Mohou třeba převážet náklad, na který jsou uvaleny sankce. Velkou pozornost – a to i ze strany zahraničních médií, například technologického magazínu Wired – vzbudila analýza SpaceKnow, která se týkala pohybu lodí v oblasti kolem výbuchu plynovodů Nord Stream. Reinštein nicméně upozorňuje, že konkrétní interpretaci musí provést zákazník, pro kterého taková analýza vznikla.
Druhým režimem jsou pak nesupervizované algoritmy, zaměřující se zejména na detekci změn v satelitních snímcích, respektive potvrzení absence změn. „Na denní bázi sledujeme aktuálně asi 200 000 lokací, ze kterých sbíráme data a agregujeme do stravitelné podoby pro naše klienty,“ doplňuje konkrétní číslo Reinštein.
„Největší výzva, které ve SpaceKnow čelíme, je to, jak naše schopnosti analyzovat cokoliv, kdekoliv a kdykoliv, přetavit v informaci, za kterou zákazník zaplatí. Postupně zasahujeme do všemožných oblastí a trhů a zjišťujeme, kde budeme mít pro klienty přidanou hodnotu. Probíhá velký produktový vývoj a obávám se, že v některých ohledech naše firma i předběhla trh pro analytiku satelitních snímků. Ukázalo se, že nejde jen o doménu agentur a vlád, ale že si může libovolná firma koupit komerční data a začít z nich vytahovat zajímavé informace. Nakonec jsme zjistili, že my sami trh tvoříme – třeba tím, že někdo z našich výzkumníků vyzkouší nějaký algoritmus a napíše o něm článek na náš blog,“ vysvětluje Reinštein, že firma je skutečným průkopníkem ve své oblasti podnikání a zákazníci se jí proaktivně ozývají a ptají se, co by s technologií ještě bylo možné dokázat.
Mírové i válečné mimikry za miliony
Na zvýšené analytické schopnosti západních firem samozřejmě ti, na které SpaceKnow a další podobné firmy nahlížejí, postupně reagují. Michal Reinštein uvádí zcela konkrétní příklad. „Dříve byly hodně populární snímky tzv. nočních světel, kdy bylo možné pozorovat, jak které fabriky v noci svítí a podle toho usuzovat, jak jsou aktivní. Když začal magazín Bloomberg vydávat články, jak firmy analyzují aktivitu fabrik po celé Číně, začali Číňané dělat to, že nechávali přes noc rozsvícené celé továrny, které nic nevyráběly. To stejné se děje i v oblasti obranného průmyslu. Vyrábějí se nafukovací makety vojenské techniky. Nebo se naaranžují dřevěné tanky či raketomety HIMARS, vypustí se o nich informace a nepřítel si na ně vyplýtvá své drahé rakety.“
Jsou při prototypování nových použití technologie SpaceKnow dovoleny občasné omyly? Jak vzniká křehká rovnováha mezi akademickým a byznysovým pojetím průzkumu z vesmíru? Proč jsou hudbou budoucnosti tzv. SAR data založená na bázi radaru? A pokazí náladu lidem ve SpaceKnow mraky? Právě tyto otázky zodpoví v dalších minutách nové epizody podcastu SCRIPTease Chief Scientist startupu SpaceKnow Michal Reinštein, kterého zpovídal moderátor Jirka Bachel z vývojářského klubu LOLO.team.