Co je to RAG (Retrieval-Augmented Generation)?
Délka:
5 min
Publikováno:
9. června 2026

Co je to RAG (Retrieval-Augmented Generation)?
RAG (Retrieval-Augmented Generation) je způsob, jak přimět jazykový model, aby odpovídal z konkrétní sady dokumentů, ne jen z toho, co se naučil při trénování. Když položíte otázku, systém nejdřív vyhledá nejdůležitější pasáže ve vašich datech a teprve pak je předá modelu spolu s vaší otázkou. Model napíše odpověď na základě tohoto materiálu, takže výsledek vychází z vašich zdrojů, místo aby si ho model vymyslel.
Stručně: najdeme správný text, předáme ho modelu a necháme ho odpovědět podle toho, co si právě přečetl.
Lidsky řečeno
Představte si běžný jazykový model jako studenta u zkoušky bez podkladů. Odpovídá z paměti, a když si nevzpomene, tipuje. RAG z toho udělá zkoušku s otevřenými materiály. Než student odpoví, najde si ve vašich dokumentech příslušné stránky, přečte si je a teprve pak píše odpověď podle toho, co na stránce skutečně stojí. Stejný student, mnohem méně vymyšlených odpovědí.
Jak RAG pipeline funguje
RAG má dvě fáze. První připraví vaše data jednou, druhá běží pokaždé, když se někdo na něco zeptá.
Příprava dat (jednou, potom při změnách):
- Rozdělíme dokumenty na malé, srozumitelné kousky, třeba po několika odstavcích. Celé osmdesátistránkové PDF je na přímé použití moc velké, proto ho rozkrájíme. Anglicky se těmto kouskům říká chunks.
- Převedeme každý kousek na embedding. Model pro embeddingy promění text na řadu čísel (vektor), která zachytí jeho význam. Pasáže o stejném tématu skončí s podobnými vektory.
- Uložíme vektory do vektorové databáze. Ta je postavená tak, aby k dotazu rychle našla nejbližší shody.
Odpověď na otázku (při každém dotazu):
- Vyhledání. Otázku převedeme na vektor stejným způsobem a vektorová databáze vrátí pár kousků, jejichž význam je jí nejblíž.
- Generování. Tyto kousky vložíme do promptu vedle otázky a model z nich sestaví odpověď. Dobré systémy zároveň vrací zdroje, aby si čtenář mohl ověřit, odkud odpověď pochází.
Model nikdy nevidí celou vaši znalostní bázi. Vidí jen malý, relevantní výsek, který pro tuto jednu otázku vybralo vyhledávání. Právě to drží odpověď u věci a náklady v rozumných mezích.
Proč na tom záleží
- Odpovědi z vašich dat. Obecný model zná veřejný internet do svého trénovacího data. RAG ho propojí s vašimi smlouvami, dokumentací produktu, tikety nebo wiki, takže umí odpovědět na otázky, na které by žádný veřejný model neuměl.
- Méně halucinací. Když má model před sebou příslušný text, má mnohem menší důvod si odpověď vymýšlet. Můžete ho také instruovat, ať řekne „nevím“, když vyhledávání nic použitelného nenajde.
- Aktuální a snadno k aktualizaci. Přetrénovat model je pomalé a drahé. U RAG stačí upravit dokumenty a další odpověď už použije nové informace. Přetrénování není potřeba.
- Dohledatelnost. Protože odpovědi vycházejí z nalezených pasáží, můžete ukázat zdroje. To hodně pomáhá v regulovaných oborech, v podpoře a všude, kde má špatná odpověď následky.
Na co si dát pozor
- Těžká část je vyhledávání, ne generování. Když systém vytáhne špatné kousky, i ten nejlepší model odpoví špatně. Většina problémů s kvalitou RAG je ve vyhledávání. Měřte ho zvlášť.
- Špatné dělení textu kazí odpovědi. Příliš velké kousky utopí důležitou větu v balastu, příliš malé ztratí kontext, který jim dával smysl. Dělit text podle jeho přirozené struktury obvykle funguje líp než podle pevného počtu znaků.
- Zastaralá data znějí sebevědomě. RAG zná jen to, co je v databázi. Když jsou vaše dokumenty neaktuální, odpověď je špatně, ale zní stejně jistě. Mějte proces, který data znovu načte při změně zdrojů.
- Sám o sobě to není bezpečnostní hranice. Pokud se uživatel může zeptat na cokoli, vyhledávání mu může vytáhnout dokumenty, které neměl vidět. Přístupová práva uplatněte už při vyhledávání, ne jen u původních souborů.
Související články
- Co je to LLM? - Jazykový model, který napíše odpověď, jakmile mu RAG předá správný materiál.
- Co je to prompt? - RAG funguje tak, že sestaví lepší prompt s vašimi nalezenými dokumenty uvnitř.
- Co to je agent? - Agenti často používají RAG jako jeden ze svých nástrojů, aby si něco dohledali, než začnou jednat.
Chcete být o krok napřed?
Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.