Co je to neuronová síť?
Neuronová síť je počítačový model, který se učí vzorce z dat, místo aby se řídil pravidly, jež ručně napsal programátor. Skládá se z mnoha malých jednotek, kterým říkáme neurony, a ty jsou uspořádané do vrstev. Každé spojení mezi neurony nese váhu, tedy číslo, které určuje, jak moc jeden neuron ovlivní další.
Informace prochází vrstvami. První vrstva přijme vstup, třeba pixely fotky. Prostřední vrstvy (často se jim říká skryté) ten signál kombinují a přetvářejí. Poslední vrstva pak vydá odpověď, například „tohle je kočka“. Při trénování síť znovu a znovu upravuje své váhy tak dlouho, dokud se její odpovědi neshodnou s příklady, které viděla.
Slovo „hluboké“ v pojmu hluboké učení znamená jednoduše síť s mnoha skrytými vrstvami. Více vrstev umožní zachytit složitější vzorce, a proto dnes neuronové sítě stojí za rozpoznáváním obrázků, hlasovými asistenty i velkými jazykovými modely.
Lidsky řečeno
Představte si velký tým lidí, kteří si předávají lístečky. Každý si přečte lísteček, který dostane, trochu ho upraví a pošle dál. Nikdo nezná celou odpověď sám, ale dohromady tým promění „surovou fotku“ v „je to kočka“. Trénování je nácvik na tisících označených fotek, při kterém se tým postupně shodne, jak moc každému lístečku věřit. A váhy říkají, jak moc každý člověk věří lístečku před sebou.
Jak se učí
Čerstvá neuronová síť startuje s náhodnými váhami, takže její první odhady jsou nesmysl. Trénování to napravuje ve smyčce. Síť dostane příklad, něco předpoví a svou předpověď porovná se správnou odpovědí. Rozdíl mezi nimi je chyba.
Síť pak posune své váhy o kousek tím směrem, který by chybu zmenšil. Tato úprava běží zpětně skrz vrstvy, a proto se metoda jmenuje zpětná propagace (backpropagation). Když to zopakujete přes miliony příkladů, váhy se ustálí na hodnotách, které dávají dobré odpovědi i na datech, jež síť nikdy neviděla.
Na kvalitě se podílejí dvě věci. První jsou data: síť se naučí jen vzorce, které v příkladech opravdu jsou. Druhá je rovnováha. Když trénujete málo, síť zůstane vágní. Když trénujete příliš úzce, příklady si zapamatuje místo toho, aby pochopila obecný vzorec, čemuž se říká přeučení (overfitting).
Kde se používá
- Obraz a video rozpoznávání obličejů, čtení naskenovaných dokumentů, hledání vad na výrobní lince.
- Jazyk překlad, shrnování a velké jazykové modely za ChatGPT, Gemini nebo Claude.
- Řeč hlasoví asistenti a živý přepis mluveného slova.
- Doporučování návrhy, které vidíte na Netflixu, Spotify nebo v e-shopu.
- Předpovědi a detekce odhad poptávky nebo označení podezřelých plateb jako podvodu.
Časté omyly
- Neuronová síť nepřemýšlí jako mozek. Přirovnání k mozku vysvětluje stavbu, ne prožitek. Uvnitř není žádné porozumění ani záměr, jen vážená matematika opakovaná v obrovském množství.
- Více vrstev není samo o sobě lepší. Větší síť potřebuje víc dat i výpočetního výkonu a hrozí jí přeučení. Správná velikost závisí na úloze.
- Není to kouzlo a není to neutrální. Síť se naučí to, co je v trénovacích datech, včetně chyb a předsudků. Pořád platí: co do ní vložíte, to dostanete.
- Může se sebejistě mýlit. Jako každý statistický model vydává nejlepší odhad, ne zaručenou pravdu. Co je důležité, vždy si ověřte.
Související články
- Co je to LLM? - Velké jazykové modely za ChatGPT a Claude stojí na neuronových sítích.
- Machine Learning vs Deep Learning - Kam neuronové sítě patří a co dělá síť „hlubokou“.
- Co to je AI? - Nejvyhledávanější pojmy okolo umělé inteligence, krátce a jednoduše.
Chcete být o krok napřed?
Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.
