Co je hluboké zpětnovazební učení?
Délka:
3 min
Publikováno:
9. června 2026

Co je hluboké zpětnovazební učení?
Hluboké zpětnovazební učení (deep reinforcement learning, deep RL) spojuje dvě myšlenky. Zpětnovazební učení trénuje model metodou pokus-omyl: model jedná, dostane odměnu nebo trest a postupně se upravuje tak, aby získal víc odměny. Hluboká neuronová síť mu navíc dá schopnost zpracovat složité a rozsáhlé vstupy, třeba surové pixely z hry nebo data ze senzorů robota. Dohromady umožní agentovi naučit se rozumné chování v prostředí, které je na ruční pravidla příliš bohaté. Díky deep RL porazila AI lidi ve hře go a dokáže řídit roboty.
Lidsky řečeno
Představte si, že učíte psa kousek pomocí pamlsků, ale ten pes má navíc oči, kterými vnímá celou složitou scénu. Zpětnovazební učení jsou ty pamlsky a opravy. Hluboká síť jsou oči a mozek, které tu scénu pochopí, takže pes dokáže spojit složitou situaci se správným pohybem.
Kdy se to hodí
- Řízení a robotika. Naučit robotické rameno uchopit předměty nebo dron stabilně létat.
- Hry a simulace. Zvládnout hry nebo trénovat agenty v simulovaném prostředí dřív, než přijdou na řadu reálná data.
- Posloupnost rozhodnutí. Úlohy, kde každá akce mění situaci a vy optimalizujete dlouhodobý výsledek, ne jednu odpověď.
Na co si dát pozor
- Hltá data i výkon. Deep RL často potřebuje miliony pokusů. Proto většina trénování probíhá v simulaci.
- Nestabilní trénování. Malá změna v odměně nebo nastavení může učení rozhodit. Vyžaduje pečlivé ladění.
- Obcházení odměny. Agent optimalizuje přesně to, co odměníte, ne to, co jste mysleli. Špatně navržená odměna vede k chytrému, ale neužitečnému chování.
Související články
- Co je zpětnovazební učení? - Základ metodou pokus-omyl, na kterém deep RL staví.
- Co je hluboké učení? - Strojové učení s neuronovými sítěmi o mnoha vrstvách.
- Co je neuronová síť? - Struktura, díky které deep RL čte složité vstupy.
Chcete být o krok napřed?
Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.