Počítačové chyby se musí řešit okamžitě po jejich nahlášení. Ví to každý správce sítě, ale realita je často odlišná. Chyby se často hromadí, nikdo je třeba roky neřeší a uživatelé jsou často nuceni si na ně zvyknout a fungovat s nimi. Právě do boje s tímto problémem se pustila česko-kanadská softwarová společnost Ataccama.
Když Tomáš Lisý do Ataccamy v září 2021 nastoupil na pozici, kde má na starosti produktovou kvalitu platformy pro unifikovanou správu dat Ataccama ONE, měla firma v záznamech 1 100 nevyřešených chyb. Navíc toto číslo velmi rychle rostlo - zhruba o sto nových záznamů měsíčně. Lisý si spočítal, že tímto tempem firma za tři čtvrtě roku překoná metu dvou tisíc bugů. Moc dobře se mu s tím nespalo, proto se rozhodl jednat.
Technologická firma, která se ze spin-offu české IT firmy Adastra stala globálním lídrem v oblasti kvality dat a loni za minoritní podíl získala investici přesahující 3,6 miliardy korun od amerického venture kapitálového fondu Bain Capital Tech Opportunities, klientům nabízí platformu pro unifikovanou správu dat a řízení jejich kvality Ataccama ONE. Produkt využívá prvků umělé inteligence a strojového učení. Pro jeho využití se už rozhodly stovky nadnárodních korporací. Patří mezi například Heineken, T-Mobile, CBRE nebo Avast. Takto velké firmy pracují s obrovským množstvím dat a velkým počtem systémů, které je v rámci data managementu složité správně integrovat. Důvod je jasný - žádný člověk není neomylný a při extrémní komplexitě vývoje se chybám nejde ubránit.
Nově bez chyb
Pro vývojáře je samozřejmě lákavější pracovat na stále nových funkcích a opravy chyb vidí jako svým způsobem nutné zlo. „Při těchto opravách si do chyb často zapisovali nápady na další zlepšení. Běžně se ve firmách chyby hromadí a řeší se pouze ty zásadní, zatímco zbytek vyšumí. V Ataccamě ale chceme zákazníkům dodávat maximální kvalitu. Rozhodli jsme se proto chyb zbavit a zvolili si filozofii jejich průběžného odbavování,“ konstatoval Lisý.
Pro chyby v Ataccamě proto nastavili režim nulové tolerance – zero bug policy. V tomto režimu je jedno, jak uživatel chybu v softwarové aplikaci (neboli bug) nahlásí, jak je vážná nebo kdo ji zavinil. Engineering tým se musí každému případu věnovat bez zbytečného odkladu.
Aby se vše vůbec mohlo rozběhnout, bylo nejprve nutné zjistit náladu ve vývojovém týmu. Část procesu, kde uživatelé ze strany klientů i engineeringu Ataccamy chyby hlásí, fungovala. Pokud by to tak nebylo, chyby by se dál nehromadily. „Drhlo to v jejich následném odbavování. Ačkoli všichni na první dobrou souhlasili s tím, budeme bugy napravovat, chyběl nám efektivní mechanismus, jak se s nimi vypořádat. Zavedli jsme proto v týmech každodenní schůzku s cílem projít seznam nových chyb a rozhodnout o nich,“ popsal Lisý proces změn.
Hned a rychleji
Zároveň byli ve firmě nuceni učinit jedno nepopulární rozhodnutí, kterému předcházela velká diskuse. Šlo o právo zavřít chybu bez jejího řešení. „Každý, kdo chyby hlásí, k nim má určitý emoční vztah a trvá na jejich nápravě. My jsme se rozhodli tento status quo narušit a přisvojit si právo veta, pokud nebude mít smysl chybu z určitých dobrých důvodů opravovat. Vyvolalo to intenzivní debaty zejména s konzultanty, ale podařilo se nám najít oboustranně přijatelné řešení,“ myslí si Lisý.
Došlo také k přenastavení pravidel tak, aby se počet bugů dál neřetězil. Každodenně se tak prochází jejich seznam a rozdělují se podle toho, co se s nimi má dále dít. „Ty, které se rozhodneme řešit, odbavujeme ideálně v rámci stejného dne. Dá se totiž čekat, že další den dorazí nová várka,“ říká Lisý s tím, že také nově měří rychlost své práce, aby získali přehled o tom, zda se jim zero bug úsilí daří. Přiznává, že zatím nejsou schopni zpracovat všechny chyby ve stejný den, postupně ale dochází ke zrychlování zpracování jednotlivých úkolů.
Aby vše mělo systém a seznam chyb se dal vnímat jako fronta úkolů k řešení, ne pouze souhrn přání, co by šlo do budoucna zlepšit, nastavil Lisý ze své pozice šéfa produktové kvality platformy několik pravidel. Kromě snahy o okamžité řešení, kdy teď je lepší než zítra, společně s kolegy každý den prochází seznam bugů, které se dál rozdělí podle toho, co se s nimi má udělat.
„Na začátku jsme měli backlog 1 460 chyb, kterému říkáme jednoduše „pool“. Cílem první akce bylo projít všechny chyby a vyčistit je tak, aby zůstaly ty skutečné, které podle nového přístupu potřebujeme řešit. Aktuálně nám z tohoto množství zbývá rozseknout 546 kousků a budeme před sebou mít teoreticky čistý stůl,“ vypočetl Lisý.
PŘEČTĚTE SI: Český startup Ataccama, který je globálním lídrem v oblasti kvality dat, získal investici přes 3,5 miliardy korun
Řešit vše nejde
Existují ale také chyby, které není možné z nějakého důvodu opravit. Jde o problémy, které jsou příliš složité nebo velmi vzácné, které nemá smysl řešit, protože snaha o nápravu by zabrala příliš úsilí, které by se nevyplatilo. Proto se v Ataccamě rozhodli, že podobné chyby budou zavírat. Uživatelům se omluví s tím, že aktuálně není možné danou chybu vyřešit.
Důležité je vyhnout se nedorozumění a případným stížnostem. I proto jsou klienti v maximální možné míře informováni, proč k zavření konkrétní chyby dochází. Ať už je důvodem nemožnost jejich snadného řešení nebo to, že se vlastně o žádný bug nejedná. Z interního sledování totiž vyšlo najevo, že ve 2-5 procentech nahlášených případů o žádnou chybu nejde.
Často jsou to poznámky vývojářů a testerů, kteří funkci hlášení chyb využívali k předkládání nápadů na možná zlepšení. „Typicky šlo o poznámky typu „pojďme to zrychlit“ nebo „přidejme testy“. Z podstaty věci nejde o chyby, je tedy žádoucí je také rychle zavřít. Takové podněty předáváme dále jako návrhy k implementaci do produktového backlogu,“ říká Lisý.
Jedeme dál
Zatím s nově zvoleným přístupem ve firmě panuje spokojenost. „Mám jisté indicie, že přes všechny porodní bolesti nám zero bug policy pomáhá. Když jsem se na poslední poradě ptal vedení, zda někomu tenhle přístup přijde zbytečný, odpovědí bylo rezolutní: „Ne, vždyť je to užitečná věc, pokračujme,“ pochvaluje si přístup nejvyššího vedení Ataccamy Lisý.
Důvod je podle něj jasný - všichni vidí, že zero bug přístup je pro firmu přínosem. A přesto, že se každý den počet nahlášených chyb zvyšuje, tak se jejich zásoba neroste. Rychlost řešení je totiž ještě vyšší. „Zatím jsem neanalyzoval přesná čísla, ale vnímám to jako signál, že se celá firma učí s bugy efektivněji pracovat. Daří se nám přibližovat k našemu cíli, nicméně i ten neustále reviduji a hledám jeho ideální polohu, která pro Ataccamu bude přínosem. A už teď vím, že úplná nula není realistický cíl,“ má Lisý jasno.
Aktuálně podle něj Ataccama směřuje k tomu, aby v každém spaceportu (organizační rozdělení firmy využívá devět spaceportů ve smyslu týmů pracujících na dané části projektu) existovalo v daný čas maximálně 30 chyb a jejich počet se v čase nezvyšoval. Takové množství dokáže podle Lisého člověk bez problémů udržet v hlavě a snížení chyb z 15 na 14 je dle něj mnohem lepší motivací než ze 144 na 143.
„Troufám si tvrdit, že tím, že chyby odstraňujeme ještě dříve než se dostanou ke klientům, dodáváme kvalitnější produkt. Klient zero bug policy pozná například tak, že v průběhu roku dostane dva servisní balíčky, které řeší chyby nahlášené přímo jím, ale i všechny ostatní nedostatky objevené v průběhu času,“ odhaluje Lisý systém, s nímž se zákazníci Ataccamy setkávají.
A co by se mu do budoucna líbilo? „Kdyby se takový přístup podařilo rozšířit dál. Mnoho šéfů vývoje by si oddechlo, protože záplava chyb je noční můrou každého CTO, který buduje nějaký softwarový produkt,“ uzavírá šéf produktové kvality platformy pro unifikovanou správu dat Ataccama ONE Lisý.
PŘEČTĚTE SI: Česko-kanadská Ataccama chce být do dvou let jednorožcem. Loni překročila příjmy 850 milionů korun