Co je sémantické vyhledávání?
Sémantické vyhledávání hledá výsledky podle významu, ne podle přesných klíčových slov. Klasické vyhledávání porovnává slova, která jste napsali, se slovy na stránce. Když napíšete „zrušit tarif“, ale stránka říká „ukončit předplatné“, vyhledávání podle klíčových slov ji mine. Sémantické vyhledávání převede váš dotaz i obsah na embeddingy, tedy seznamy čísel, které zachycují význam, a pak najde nejbližší shody. Slova už spolu nemusí souhlasit. Stačí, když souhlasí myšlenky.
Lidsky řečeno
Vyhledávání podle klíčových slov je knihovník, který najde jen knihy s vašimi přesnými slovy na obálce. Sémantické vyhledávání je knihovník, který opravdu ví, o čem knihy jsou. Když si řeknete o „něco na opravu kapajícího kohoutku“, podá vám příručku pro instalatéry, i když „kapající kohoutek“ nikde nestojí. Hledá to, co myslíte, ne to, co jste řekli.
Kdy se vám to hodí
- Nápověda a dokumentace. Zákazníci málokdy použijí vaše přesná slova. Sémantické vyhledávání jim správný článek najde i tak.
- Interní znalosti. Najdete správný dokument napříč wiki, tikety a chatem, aniž byste si museli pamatovat přesný název.
- Krok vyhledání v RAG. Vytáhnete z vašich dat nejrelevantnější úryvky a předáte je jazykovému modelu, aby napsal odpověď.
- Doporučování a hledání duplicit. Seskupíte podobné produkty, články nebo záznamy, které říkají totéž jinými slovy.
Na co si dát pozor
- Blízké významem není vždycky správné. Sémantické vyhledávání vrací související obsah, ne ověřená fakta. U přesných termínů, kódů nebo jmen pořád vítězí klíčová slova, proto řada týmů kombinuje obojí (hybridní vyhledávání).
- Je tak dobré jako embedding model. Model, který nezná váš obor nebo jazyk, seřadí výsledky špatně. Otestujte ho na svých reálných dotazech.
- Změníte model, indexujte znovu. Embeddingy z různých modelů spolu neporovnáte. Když model vyměníte, starý index vám tiše přestane fungovat.
Související články
- Co jsou embeddingy? - Čísla, díky kterým počítač umí porovnat význam. Motor za sémantickým vyhledáváním.
- Co je vektorová databáze? - Kam se embeddingy ukládají, abyste jich uměli rychle prohledat miliony.
- Co je to RAG (Retrieval-Augmented Generation)? - Jak sémantické vyhledávání přivede vaše vlastní data do odpovědí AI.
Chcete být o krok napřed?
Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.
