Co je vektorová databáze?

Délka:

4 min

Publikováno:

9. června 2026

Co je vektorová databáze?

Vektorová databáze je databáze postavená na ukládání a hledání embeddingů, tedy seznamů čísel, které zachycují význam textu, obrázku nebo zvuku. Místo aby hledala přesná klíčová slova, najde položky, jejichž význam je nejblíž vašemu dotazu. Tomu se říká vyhledávání podle podobnosti a právě díky němu aplikace vrátí relevantní výsledky, i když se slova neshodují.

Čísla pocházejí z AI modelu, který obsah převede na embedding: bod ve vícerozměrném prostoru, kde podobné významy leží blízko sebe. Databáze tyto body indexuje, takže během milisekund odpoví na otázku „co je tomuto nejpodobnější?“, i kdyby šlo o miliony položek.

Lidsky řečeno

Představte si obří knihovnu, kde knihy nestojí podle názvu, ale podle tématu, a podobná témata jsou vedle sebe. Když přijdete a popíšete, co hledáte, knihovník vás dovede rovnou ke správné polici, místo aby četl každý hřbet. Vektorová databáze je přesně tento systém řazení: ukládá věci podle významu, takže „najdi mi něco podobného“ znamená pár kroků, ne procházení celé knihovny.

Proč na tom v AI záleží

Většina užitečných AI funkcí stojí na tom, že rychle najdou tu správnou informaci. A přesně to vektorová databáze umožňuje.

Sémantické vyhledávání. Lidé hledají podle záměru, ne podle přesných slov. Dotaz „jak zruším předplatné“ najde článek o „ukončení odběru“, i když se slova liší.
RAG (retrieval-augmented generation). Než LLM odpoví, aplikace nejdřív vytáhne z vašich dokumentů nejrelevantnější úryvky a předá mu je jako kontext. To vyhledání zajišťuje vektorová databáze, a právě díky tomu chatbot odpovídá na otázky o vašich datech, místo aby hádal.
Doporučování a hledání duplicit. Návrhy typu „další podobné“ i odhalování téměř shodných záznamů se nakonec vždy scvrknou na hledání blízkých vektorů.

Stručně řečeno, vektorová databáze je vrstva paměti, která propojí obecný model s vaším konkrétním obsahem.

Kdy ji použít

Vektorová databáze se vyplatí tam, kde víc než přesná shoda rozhoduje význam.

Chcete, aby lidé hledali podle konceptu, ne podle klíčového slova.
Stavíte RAG, aby LLM odpovídal z vašich dokumentů, znalostní báze nebo tiketů z podpory.
Potřebujete doporučování nebo hledání podobnosti napříč textem, obrázky či zvukem.

Pokud máte málo dat (pár stovek položek) nebo se ptáte na přesné hodnoty (číslo objednávky, e-mailová adresa), nejspíš ji nepotřebujete. Stačí běžná databáze, nebo i obyčejné pole s funkcí na výpočet podobnosti. Hodně týmů taky začíná s vektorovým rozšířením databáze, kterou už provozuje, třeba pgvector pro PostgreSQL, než sáhne po samostatném úložišti jako Pinecone, Qdrant, Weaviate nebo Milvus.

Na co si dát pozor

Špatné embeddingy, špatné výsledky. Kvalita vyhledávání závisí na modelu, který embeddingy vytváří. Když model vyměníte, většinou musíte všechno přepočítat znovu, protože vektory z různých modelů nejdou porovnávat.
Najde podobné, ne správné. Vyhledávání podle podobnosti vrací nejbližší shody, ne zaručené odpovědi. U RAG navíc může LLM vytažené úryvky pořád špatně pochopit, takže to, na čem záleží, nechte zkontrolovat člověkem.
Velikost úseků mění odpověď. Když dokument rozdělíte na příliš velké úseky, podstatná část se ztratí v balastu; příliš malé úseky zase přijdou o kontext. Toto často rozhoduje víc než volba samotné databáze.
Není to plná náhrada. Pro strukturovaná data, filtry a transakce pořád potřebujete běžnou databázi. Vektorové vyhledávání ji doplňuje, nenahrazuje.

Související články

Co je to LLM? - Model, který z vytaženého kontextu sestaví odpověď.
Co to je AI? - Nejvyhledávanější a nejpoužívanější pojmy, které souvisejí s umělou inteligencí. Krátce a jednoduše.
Co to je agent? - AI, která plánuje a jedná, a cestou si často tahá kontext právě z vektorové databáze.

Zpět na postřehy

Chcete být o krok napřed?

Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.