Podcast SCRIPTease: Módní srovnávač GLAMI má v katalogu 17 milionů produktů, rozezná je s pomocí umělé inteligence
Ondřej Čech pracuje v GLAMI od prvopočátku firmy. Foto: Lolo.team

Podcast SCRIPTease: Módní srovnávač GLAMI má v katalogu 17 milionů produktů, rozezná je s pomocí umělé inteligence

15. pro 2022 Redakce 6 min

Podnikatel Tomáš Hodboď patří mezi nejvýraznější osobnosti české e-commerce scény. Partner jablonecké investiční skupiny Miton a bývalý CEO srovnávače Heureka v roce 2013 spolu s Michalem Jirákem založil módní vyhledávač GLAMI. Na pozici výkonného ředitele zde působil až do začátku listopadu, kdy jej vystřídal Ján Kešelák. Hostem technologického podcastu SCRIPTease byl Ondřej Čech, vedoucí vývojových týmů v GLAMI. Ve firmě, která již za pár měsíců oslaví první dekádu úspěšného působení na trhu, pracuje od jejího prvopočátku.

Článek vznikl v rámci spolupráce SJ News a podcastu SCRIPTease. Celou epizodu si můžete poslechnout zde:

„GLAMI je módní vyhledávač působící ve 19 zemích. Máme zapojených 4300 e-shopů a měsíčně k nim přivedeme půl milionu objednávek. Celkem je v katalogu asi 17 milionů produktů, přičemž informace o nich se snažíme aktualizovat minimálně jednou za 2 hodiny,“ popisuje Čech. V České republice jsou v současnosti dostupné necelé 3 miliony z nich, a to asi od 30 000 různých módních značek. Patří mezi ně sportovní giganti jako Adidas, Nike, Puma a Reebook, prémiové značky Calvin Klein či Tommy Hilfiger, ale také online verze kamenných prodejen Reserved, House či Mango.

Ondřej Čech z GLAMI byl hostem podcastu SCRIPTease. Foto: Lolo.team

„Když se do GLAMI zapojuje e-shop, poskytne nám svůj XML feed (seznam položek a metadat ve strojově čitelném formátu – pozn. red.), který obsahuje veškerou nabídku jeho produktů. My tento feed zpracujeme, přidáme k němu štítky a zobrazíme jej u nás na GLAMI. Produkty následně promujeme například na Google. Zákazník, který hledá červené tričko, přijde přes vyhledávač do GLAMI, my ho pošleme do jednoho ze 4300 obchodů, a za přivedení zákazníka si řekneme od e-shopu o provizi,“ vysvětluje Ondřej Čech obchodní model společnosti. „Import jako takový trvá pár minut, o trochu delší čas zabere stažení všech obrázků a provedení automatizovaných operací v rámci Amazon Web Services,“ dodává.

Zákazník, který ví, pro co přišel

Co je přidanou hodnotou portálu GLAMI ve srovnání s klasickou PPC reklamou realizovanou napřímo daným e-shopem v jednotlivých vyhledávačích a srovnávačích? „Kromě všeobecného navýšení provozu na webu je důležitým důvodem to, že přivádíme kvalitnějšího zákazníka, než si oni sami na Google umí koupit. Když totiž projde přes nás, vyfiltruje si už konkrétní tričko v nějaké velikosti, s výstřihem, límečkem, jak chce, a je tedy více konverzní než z jiného zdroje (pravděpodobnost, že si produkt skutečně zakoupí, je větší – pozn. red.),“ upřesňuje Ondřej Čech.

Platforma GLAMI vznikla před deseti lety na zelené louce, a tak na začátku neměla takovou vyjednávací pozici, aby u napojených e-shopů vyžadovala nějaká specifika v oblasti technického propojení. „Akceptovali jsme tedy například XML feed vytvořený pro portál Heureka nebo srovnávač zboží na Google. Historicky dokážeme zpracovat jakýkoliv feed, umíme k jednotlivým řádkům pomocí interního nástroje přiřadit, jestli je v nich název produktu nebo třeba cena,“ popisuje Ondřej Čech začátky budování GLAMI. Importovaná data se nyní snaží v GLAMI při zpracování zlepšovat a čistit. „Pomocí srovnávače obrázků či URL adresy hledáme a odebíráme potenciálně duplicitní produkty. Nebo hledáme položky, které jsou ve skutečnosti jeden produkt a liší se pouze velikostí, a podobně,“ dodává.

Ondřej Čech pracuje v GLAMI od prvopočátku firmy. Foto: Lolo.team

Tisíce bílých košilí systém nezastaví

Jak probíhá proces přidání nového zboží do srovnávacího katalogu? „Pro začátek musíme vědět, co každý produkt představuje. Člověk bezpečně pozná podle obrázku nebo názvu, jestli jde o tričko, nebo boty. Ale my to musíme říct i našemu systému. Dříve jsme to dělali pomocí kategorie, což byl pro e-shopy povinný element, který jsme pak manuálně párovali na naše vlastní kategorie na GLAMI. Aktuálně to děláme s pomocí neuronových sítí, máme na to model vyvinutý za využití strojového učení, který tuto práci dělá za nás,“ vysvětluje Ondřej Čech. Celkem 19 zapojených zemí samozřejmě znamená i velkou různorodost jazykových mutací, s čímž si GLAMI poradilo prostřednictvím tzv. jazykově agnostického modelu, který dokáže zpracovávat a párovat data zcela nezávisle na tom, v jakém jazyce jsou.

Chybovost při zpracování dat od obchodů po celé Evropě (a také v jihoamerické Brazílii, kam firma expandovala v roce 2019) se tak pohybuje výrazně pod hranicí jednoho procenta a položky, u kterých se technologie neumí rozhodnout, míří ke specialistům na manuální zpracování. „O kus jednodušší je to v tom, že máme téměř jistotu, že se jedná o nějaký módní produkt, takže nemusíme řešit, jestli daný záznam není třeba pračka nebo láhev s nápojem,“ směje se Ondřej Čech.

GLAMI využívá ve svých produktech následující technologie:
PHP8, MySQL, Elasticsearch, React, TypeScript, ClickHouse a Gearman.

Jedním z velkých rozdílů oproti populárním srovnávačům zboží, jako je Heureka nebo Zboží od Seznamu, je to, že GLAMI zatím nespojuje stejné produkty na jednu stránku, kde by se zákazník orientoval podle dalších informací, například ceny. „Pokud to samé tričko nabízejí dva různé obchody, znamená to, že u nás bude víckrát. Řekli jsme si, že se to ve fashion světě nebude stávat tak často jako například u mobilů, notebooků nebo televizí. Děje se to například u tenisek, protože hodně prodejců má v nabídce kupříkladu boty od firmy adidas, takže připravujeme nový model, který s tím bude počítat,“ popisuje Ondřej Čech. „Na pozadí ještě běží automatický systém na bázi strojového učení, který produkty dle obrázků a popisků štítkuje – od druhů výstřihů a límečků až po to, jestli je tričko puntíkované,“ dodává.

Do cloudu se GLAMI nehrne – není proč

Technologicky je platforma GLAMI v podstatě monolitická. Naprostá většina řešení běží ve dvou datacentrech v Praze a je postavena na frameworku Nette, který ve světě proslavil českého programátora Davida Grudla. Výjimku tvoří pouze samostatné byznysové dashboardy pro partnery GLAMI, a pak vše, co nějakým způsobem souvisí s umělou inteligencí (AI). Pro tyto výpočty se využívá síla outsourcovaných strojů od společnosti Amazon. Přechod hlavních systémů do cloudu nezačala firma zvažovat ani jako možnou reakci na internetovou nákupní horečku spojenou s pandemií nemoci covid-19. „Zaznamenali jsme nějaký nárůst zákazníků, ale zase tolik to nebylo, ne třeba desetkrát tolik,“ říká Ondřej Čech. „AWS je super pro řešení, které využívá AI tým, ale na prodeji nemáme žádné zásadní výkyvy, vyjma sezóny (předvánoční – pozn. red.), která začíná v září a vrcholí v listopadu.“

Ondřej Čech pracuje v GLAMI od prvopočátku firmy. Foto: Lolo.team

Celkem v GLAMI najdeme kromě osmičlenného AI týmu, který stojí tak trochu stranou dění, čtyři hlavní platformní týmy – celkem dvacítku lidí, které Ondřej Čech vede. Starají se o košík a kategorie, dashboardy, mobilní aplikace či problematiku DevOps (skloubení vývoje a provozu aplikací – pozn. red.). Ukazatelem, který se bedlivě sleduje na denní bázi, je zejména výkon, tedy rychlost načítání stránek u uživatelů. Jakýkoliv výkyv totiž potenciálně znamená ztrátu netrpělivých koncových zákazníků i výraznou penalizaci ze strany vyhledávače Google.

Jak vypadá běžný den nováčka v GLAMI? Jaká jsou specifika testování webových aplikací, se kterými musí tým pod vedením Ondřeje Čecha počítat? Bylo po technické stránce potřeba udělat něco speciálního během expanze do Řecka, Itálie nebo vzdálené Brazílie? A jak může platformě typu GLAMI pomoci implementace nástroje Google Tag Manager? To vše se dozvíte v další epizodě podcastu SCRIPTease, věnované i tomu, jak (dříve velmi startupové) GLAMI v současnosti postupně splácí svůj technologický dluh. Hosta podcastu Ondřeje Čecha vyzpovídal jako vždy moderátor Jirka Bachel z vývojářského klubu LOLO.team.

Podcast SCRIPTease: IT v pojišťovnictví je běh na dlouhou trať, říká šéf vývoje v NN Česká republika

Podcast SCRIPTease: Máte firemní mobil s iOS? Pak se o bezpečnost dat v něm nejspíš stará software s výraznou českou stopou

Líbil se vám článek? Sdílejte jej!
Přečtěte si dále
Související témata: Podcast
Nenechte si uplavat nové články!
Váš e-mail
Sledujte nás:
Další články