Říjen se nesl ve znamení open-source. Vedle nových modelů jsme se dočkali i posunu v tom, kde modely běží. Místo jen rychlejších LLM vzniká ekosystém, ve kterém modely pracují přímo uvnitř nástrojů, které používáte každý den. A i když schopnosti rostou, aktivní část modelů se dál zmenšuje (aktivní parametry v MoE). Výkon tak už není jen o počtu parametrů, ale hlavně o datech, tréninku a architektuře.
Apriel v1.5
Malý, ale silný open-source model od ServiceNow. Na žebříčku Artificial Analysis Intelligence Index dosahuje zhruba 52 bodů a drží krok s výrazně většími modely (DeepSeek R1 0528, Gemini-Flash a podobně). Pěkně ukazuje, že kvalita dat a způsob tréninku dnes často porazí hrubý počet parametrů.
Užitečné zdroje: Artificial Analysis
OpenAI Apps a Apps SDK
OpenAI představil „apps“ pro ChatGPT a Apps SDK. V praxi jde o MCP servery, které poskytují vlastní rozhraní přímo v ChatGPT. Integrace třetích stran do konverzací s GPT je díky tomu mnohem přívětivější. S tím přichází i nový obrovský marketplace pro tvorbu aplikací, a to s víc než 800 miliony aktivních uživatelů.
Užitečné zdroje: OpenAI
MiniMax M2
MiniMax zveřejnil model M2. V žebříčku Artificial Analysis sáhl na nové maximum mezi open-source modely (okolo 61 bodů), a to s přibližně 10 miliardami aktivních parametrů (z 200 miliard celkem v MoE). Aktuálně jde o nejchytřejší open-source model a pátý nejchytřejší model vůbec. M2 cílí především na agenty a kód.
Užitečné zdroje: Artificial Analysis
Cursor 2.0
Cursor 2.0 posouvá editor k agentnímu přístupu. V zobrazení Agents spustíte až 8 agentů paralelně (klidně s různými modely), v jednom přehledu porovnáte jejich postupy a vyberete nejlepší výsledek. Díky git worktrees běží změny v izolovaných kopiích repozitáře, takže ve stejném projektu můžete dál normálně kódovat bez kolizí. Návrhy jsou navíc jasně oddělené, což usnadňuje code review i audit. Součástí je i Composer 1, vlastní model Cursoru pro rychlé agentní smyčky (uvádí se až čtyřnásobná rychlost oproti podobně schopným modelům). V praxi to znamená méně slepých uliček, víc použitelných variant řešení a rychlejší iterace při refaktoringu i průzkumu, protože Cursor přístupy zkouší paralelně.
Užitečné zdroje: Cursor
Říjen pěkně ukazuje, že počet parametrů už není všechno. Stále víc rozhoduje kvalita dat, architektura a způsob trénování. Rozdíl mezi open-source a closed-source modely se dál zmenšuje (pátý nejvýkonnější model je dokonce open source), takže týmy mají víc prostoru optimalizovat cenu i nasazení.
Zároveň klesá aktivní velikost modelů, i když jejich schopnosti rostou. Stále častěji jde o fragmentované MoE přístupy, kde se chytře zapínají jen potřebné expertní části. A to nejdůležitější nakonec: hodnota se přesouvá od honby za novými modely k tomu, jak AI dostat do reálné práce. Do IDE, do chatu a do interních nástrojů, kde lidem skutečně zrychluje práci a zvedá kvalitu výstupu.
Související články
Pokud vás zajímají další AI novinky a trendy:
- Zářijové AI novinky - Nový měsíc je tady a s ním i zářijové AI novinky
- Co je Mixture of Experts (MoE) a proč se o tom teď mluví? - Mixture of Experts by mohla vyřešit jeden z největších problémů současné AI
- Co je to Cursor a co umí? - IDE, které využívá AI
- Jak začít s GitHub Copilot? - GitHub Copilot krok za krokem
Chcete být o krok napřed?
Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.
