Co je observabilita?
Observabilita je schopnost zvenčí pochopit, co se děje uvnitř běžícího systému, a to z dat, která systém sám vydává. Tato data mají tři podoby, kterým se říká tři pilíře: logy (záznam jednotlivých událostí), metriky (čísla měřená v čase, třeba počet požadavků nebo počet chyb) a trasování (cesta jednoho požadavku napříč vašimi službami).
Lidé si observabilitu často pletou s monitoringem, ale každý odpovídá na jinou otázku. Monitoring vám řekne, jestli je něco špatně: graf zčervená, spustí se upozornění. Observabilita vám pomáhá ptát se, proč je to špatně, i u poruch, které jste vůbec nečekali. Monitoring hlídá to, o čem jste předem věděli, že to máte hlídat. Observabilita vám umožní vyšetřit i problémy, které jste nepředvídali.
Lidsky řečeno
Představte si palubní desku auta. Kontrolky jsou monitoring: rozsvítí se kontrolka oleje, takže víte, že je problém. Sama deska vám ale neřekne, jestli selhává čerpadlo, někde uniká olej, nebo se jen porouchalo čidlo. Observabilita je připojit diagnostiku a přečíst si celý obraz, abyste skutečnou příčinu našli, a ne hádali.
Tři pilíře
Tyto tři druhy dat se překrývají a dobré nastavení je propojí, abyste mohli při vyšetřování plynule přecházet od jednoho ke druhému.
- Logy jsou záznamy jednotlivých událostí s časem: „uživatel se přihlásil“, „platba selhala“, „dotaz do databáze vypršel“. Dávají vám detail a kontext, ale samy o sobě se ve velkém objemu těžko prohledávají.
- Metriky jsou čísla měřená a sčítaná v čase: požadavky za sekundu, podíl chyb, využití paměti, doba odezvy. Levně se ukládají a hodí se na sledování trendů i na spouštění upozornění.
- Trasování sleduje jeden požadavek přes každou službu, kterou cestou projde. V systému z mnoha malých služeb vám trasování přesně ukáže, kde se strávil čas a kde se požadavek zlomil.
Skutečná hodnota vzniká, když je propojíte. Všimnete si nárůstu v metrice chyb, skočíte na trasování za těmito chybami a přečtete si logy kroku, který selhal. Tento řetězec promění vágní „web je pomalý“ v přesné „platební služba čeká čtyři sekundy na kontrolu proti podvodům“.
Proč na tom záleží
Dnešní software málokdy běží jako jeden program na jednom serveru. Je rozprostřený do mnoha služeb, kontejnerů a cizích API. Když se něco rozbije, příčina často leží o několik vrstev dál než příznak. Observabilita je to, co takové systémy dělá odladitelnými.
- Rychlejší řešení incidentů. Když dokážete vystopovat problém k jeho zdroji, hledáte příčinu minuty místo hodin hádání.
- Méně dohadů v produkci. Vyšetřujete s důkazy, ne tak, že znovu nasadíte aplikaci s vypisováním do konzole a doufáte.
- Lepší rozhodování. Stejná data vám ukážou, které části jsou pomalé, které funkce lidé opravdu používají a kam vložit úsilí vývojářů.
- Klidnější pohotovost. Dobrá observabilita znamená, že upozornění míří na skutečný problém, takže člověka na pohotovosti nikdo nebudí kvůli slepé uličce.
Na co si dát pozor
- Sbírat všechno a nečíst nic. Více dat ještě neznamená lepší observabilitu. Když logujete každý detail, ale nikdy ho nestrukturujete ani nepropojíte, platíte za úložiště a stejně na otázky neodpovíte.
- Brát to jako nástroj, který se koupí. Dodavatel vám dá platformu, ne vhled. Observabilita stojí na tom, že váš kód vydává užitečná a strukturovaná data už od začátku.
- Plést si grafy s pochopením. Stěna zelených grafů uklidňuje, jenže pokrývá jen poruchy, které jste čekali. Smyslem je vyšetřit ty, které jste nečekali.
- Nehlídat náklady. Logy a trasování se rychle nasčítají. Rozhodněte, co stojí za uchování, u velkých objemů trasování vzorkujte a nastavte rozumnou dobu uchování místo toho, abyste ukládali všechno navždy.
Související články
- Co je CI/CD? - Jak automatizované pipeline pro sestavení, testování a nasazení bezpečně dostávají kód do produkce.
- Jak platformy pro řízení incidentů usnadňují práci vývojářům - Jak z upozornění udělat klidný a opakovatelný postup.
- Co je platform engineering? - Stavba interních základů, díky kterým jde dodávání softwaru hladčeji.
Chcete být o krok napřed?
Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.
