Listopad patřil frontier modelům a agentním nástrojům pro vývojáře. Nejde už o vyšší skóre v benchmarcích. Jde o to, jak dobře model zvládne reálnou práci v repozitáři, dlouhou konverzaci a automatizovaný workflow.
Claude Opus 4.5
Claude Opus 4.5 je zatím nejvýkonnější model od Anthropic. Výrazně se zlepšil v kódování, práci s autonomními agenty, analýze dat, tabulkách i přípravě prezentací. Spolehlivě zvládne vícekrokový workflow, dlouhý kontext i složité úlohy, a přitom spotřebuje míň tokenů, takže pracuje úsporněji. To z něj dělá dobrou volbu pro nasazení ve firmě, automatizaci procesů i rozsáhlé agentní scénáře.
Užitečné zdroje: Claude Opus 4.5
Gemini 3 Pro
Gemini 3 Pro je první model, o kterém můžeme říct, že posouvá laťku skoro ve všech benchmarcích. V Artificial Analysis Indexu se drží nad GPT-5.1, podle některých zdrojů zhruba o tři body. Na ARC-AGI 2 zdvojnásobil dosavadní nejlepší výsledek. Podle některých zdrojů jde o opravdu obrovský model, asi 2–3x větší než ostatní proprietární modely. Ukazuje, že škálování pořád funguje, jen ho je čím dál těžší dosáhnout.
Užitečné zdroje: Gemini 3 Pro
OpenAI GPT-5.1
OpenAI vydalo nový model GPT-5.1. Hlavní posun je v rychlosti a efektivitě běhu, samotná inteligence se naopak změnila jen málo. Model nabízí dva režimy: Instant pro rychlé odpovědi a Thinking pro náročnější úlohy, kde se vyplatí delší přemýšlení. K dispozici je v několika velikostech, od Mini po Pro. Novinkou je výrazně větší kontextové okno, takže s rozsáhlejší kódovou bází nebo dokumentací zvládnete pracovat v jednom záběru.
Užitečné zdroje: OpenAI: přehled GPT-5.1 a režimů Instant / Thinking
OpenAI GPT-5.1 Codex Max
GPT-5.1-Codex-Max je nový frontier model od OpenAI zaměřený čistě na programování a agentní práci. Kombinuje chain-of-thought, tedy generování mezikroků uvažování, s technikou context-compaction. Díky tomu utáhne dlouhé a projektově rozsáhlé úlohy, jako jsou refaktoringy, rozsáhlé debugování nebo generování složitých systémů, aniž by se přetížilo kontextové okno.
Užitečné zdroje: OpenAI 5.1 Codex Max
Moonshot Kimi K2
Kimi K2 je open-source model s bilionem parametrů, z nichž se při inferenci aktivuje zhruba 32 miliard. Sedne týmům, které chtějí mít kontrolu nad svými daty a zároveň potřebují špičkový výkon v agentních a automatizačních úlohách. Kvůli velikosti ale potřebuje robustní infrastrukturu. Provoz běžně znamená několik GPU, například high-end karty nebo specializované clustery, protože plný chod si žádá hodně paměti, VRAM a výpočetního výkonu.
Užitečné zdroje: Moonshot Kimi K2
Grok 4.1
Grok 4.1 dobře pracuje s emocemi a mezilidským kontextem. Varianta Fast zvládne až 2 miliony tokenů, takže unese velkou kódovou bázi nebo dlouhou konverzaci. Díky Agent Tools API se hodí pro produkční agenty a náročný tool-calling. Objevil se ale problém s přehnaným chválením Muska a výrazným zaujetím, což naznačuje možný bias. U citlivých témat, jako je historie, politika nebo ověřená fakta, proto jeho odpovědi nemusí být dostatečně neutrální ani spolehlivé.
Užitečné zdroje: Grok 4.1, TechCrunch
Google Antigravity
Antigravity je nové agent-first IDE od Googlu postavené kolem Gemini 3 Pro. V praxi jde o vývojové prostředí, kde mají agenti přímý přístup do editoru, terminálu i prohlížeče, takže si dokážou kód sami napsat, spustit i ověřit. Hned po vydání ale někteří uživatelé hlásili nedostupnost modelu kvůli velkému zatížení. Objevily se i vážné bezpečnostní zranitelnosti: při výchozím nastavení můžou agenti číst citlivé soubory a spouštět libovolné příkazy.
Užitečné zdroje: Google Antigravity, Techradar
Listopad hezky ukazuje, že nejde o co největší a nejchytřejší model, ale o to, jak dobře sedne na konkrétní práci a stack týmu. Specializované modely na kód, rychlé malé modely i silné open-source alternativy dávají mnohem víc prostoru ladit výkon, cenu a kontrolu nad daty. A čím dál víc platí, že skutečná hodnota vzniká ve chvíli, kdy AI dobře napojíte do IDE, chatu a interních nástrojů, kde reálně zrychluje vývoj.
Související články
Pokud vás zajímají další AI novinky a trendy:
- Říjnové AI novinky – nový měsíc je tady a s ním i říjnové AI novinky.
- Zářijové AI novinky – jako vždy zde najdete výběr toho nejpodstatnějšího ze světa umělé inteligence.
- AI: Pomocník nebo hrozba pro juniory? – AI ve vývoji očima juniora.
- Jak začít s GitHub Copilot? – GitHub Copilot krok za krokem.
Chcete být o krok napřed?
Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.
