Výbušné drama v Meta, šokující transparentnost v OpenAI a vývoj, který nás od AGI dělí jen několik měsíců. Tedy – tento týden v umělé inteligenci.
Pokud jste tento týden zmeškali novinky o AI, povíme vám jen jednu věc: Máta poklekla (znovu), Claude se stane vedoucím kanceláře, OpenAI konečně přijímá open source a Google rozvíjí svou vizi umělého super asistenta, který umí stříhat video lépe než vy. A to není vtip. Toto je tento týden v oblasti umělé inteligence – vydání 15.
#15 tento týden v umělé inteligenci:
Katastrofa Meta and the Llama 4
Llama 4 měla být korunním klenotem vývoje AI společnosti Meta, ale konečný výsledek je zklamáním. Model, který byl představen veřejnosti, není ten, který se účastnil benchmarků a zaujal. Toho si jako první všiml profesor Ethan Mollick, který potvrdil, že výsledky modelu zveřejněné v LLM-areně neodpovídají výsledkům veřejné verze. (zdroj: x.com/ethanmollick)
Na Redditu se pak objevily příspěvky od bývalých zaměstnanců Meta, kteří nyní pracují v OpenAI, a otevřeně se distancovali od Llama 4. Jeden z nich napsal do svého profilu: "Llama 2 a Llama 3, Llama 4? Nemám s tím nic společného." (zdroj: reddit.com)
Kromě toho se objevily informace, že vnitřní otřes v divizi AI společnosti Meta byl spuštěn, když je v benchmarcích předběhl neznámý a nízkorozpočtový čínský model DeepSeek V3. Pro společnost investující miliardy do vývoje umělé inteligence to není žádná maličkost.
Claude Max a předpovědi o Claude 4
Společnost Antropic tento týden překvapila novou službou Claude Max – plán předplatného pro náročné uživatele, který nabízí pětkrát až dvacetkrát vyšší kvótu interakcí, přednostní přístup k nejnovějším modelům a funkcím. (zdroj: anthropic.com)
Mezitím Jared Kaplan, hlavní vědec společnosti Anthropic, oznámil, že Claude 4 uvidíme během příštích šesti měsíců. Vývoj modelů AI podle něj probíhá rychleji než vývoj hardwaru, a to především díky zrychlenému post-tréninku a vylepšením v posilování. Jedna z jemných, ale hlavních zpráv tohoto týdne o umělé inteligenci.
OpenAI konečně oznamuje open source model
Po letech kritiky za nedostatek transparentnosti a distancování se od svého původního poslání Sam Altman oznámil, že OpenAI brzy vydá open-source model, který překoná všechny stávající alternativy. (zdroj: openai.com)
ChatGPT má nyní navíc dlouhodobou paměť, která umožňuje využít minulé interakce k personalizaci zážitků a umožňuje uživateli, aby umělá inteligence aktivně sledovala své cíle a vedla je přes nekompatibilitu ve vzorcích myšlení.
Ale ne všechno je tak růžové: zkrácené bezpečnostní testování v OpenAI
Financial Times odhalil, že OpenAI výrazně zkrátila dobu a rozsah testování bezpečnosti svých modelů. Namísto několika týdnů mají nyní jen pár dní, což vyvolává obavy, že by modely mohly být zveřejněny s neobjevenými zranitelnostmi. Bývalý zkušební inženýr řekl FT, že nebezpečí GPT-4 bylo objeveno pouhé dva měsíce po jeho vydání. (zdroj: ft.com)
Důvod je prý jednoduchý – konkurenční tlak. Firmy spěchají s představením nových modelů, aby nezůstaly pozadu. A přestože se jedná o nejmocnější nástroje naší doby, bezpečnost je odsouvána na okraj.
DeepCode 14B: open-source konkurent OpenAI
Představeny DeepSeek a Aentica DeepCode 14B, model s otevřeným zdrojovým kódem pro generování softwarového kódu. S pouhými 14 miliardami parametrů dosahuje výsledků srovnatelných s komerčními modely GPT-3.5. Trénovali jej více než 24 000 unikátními úkoly a použili metodu GRPO+, která model odměňuje pouze za dokonalé řešení. (zdroj: github.com/aentica)
BrowseComp: Nová liga pro AI agenty
OpenAI představila BrowseComp, benchmark pro agenty AI, kteří mohou efektivně procházet web a vyhledávat složité informace. Je určen pro testování modelů, které musí procházet desítky stránek, aby se dostaly k relevantním informacím. (zdroj: github.com/openai/simple-evals)
Google vede hru
Google odhaluje plány fúzí Blíženci a Vio modely – porozumění textu, obrazu a zvuku s generováním videa. Jejich cílem je vytvořit multimodálního super asistenta, který rozumí světu jako my. (zdroj: googlecloudnext.com)
Kromě toho Google představil novou generaci AI čipů TPU Ironwood, který je 3600krát výkonnější než první generace z roku 2018. To jim umožňuje trénovat větší modely a provozovat je rychleji bez závislosti na Nvidii.
Microsoft Copilot se stává vážným konkurentem
společnosti Microsoft Druhý pilot Má přepracované rozhraní, funkce pro vyhledávání bytů, pomoc s psaním dopisů a dokonce i možnosti úpravy obrázků. Funguje jako osobní asistent v reálném čase s přístupem k obrazovce a kontextu. (zdroj: microsoft.com)
Mustafa Suleyman, šéf Microsoft AI, věří, že AGI by tu mohlo být do pěti let, i když uznává, že základní problémy – jako jsou halucinace a špatné dodržování pokynů – ještě nebyly vyřešeny.
Midjourney v7: úžasné obrázky, ale stále žádný text
Midjourney vydala sedmou generaci svého zobrazovacího modelu, který zaujme hyperrealismem. Generování textu však stále značně zaostává, jak sami přiznávají – uživatelé jej téměř nepoužívají, takže není prioritou. (zdroj: midjourney.com)
Neo robot pracující živě
Robotická platforma 1X Neo prokázala, že dokáže samostatně vykonávat živé úkoly. Toto není jen další PR trik; robot se pohyboval, čistil, fungoval bez skriptů. Jeho konstrukce zahrnuje umělé svaly a pohyblivost, která mu umožňuje bezpečně koexistovat s lidmi. (zdroj: 1x.tech)
AI vědec píše první odborný článek
Sakana AI Labs oznámila, že jejich model napsal první vědeckou práci, která prošla recenzním řízením na workshopu. Umělá inteligence formulovala hypotézu, analyzovala data a vyvodila závěry – bez lidské pomoci. (zdroj: sakana.ai)
Závěr
Za pouhý týden jsme byli svědky kolapsu vize Meta, akcelerace open source modelů, nebezpečných trendů v testování bezpečnosti a nové generace multimodálních agentů. Svět umělé inteligence se nejen rychle vyvíjí – vyvíjí se směrem, který se ještě před rokem zdál jako sci-fi.
Příští týden slibuje ještě víc. Pokud vám něco chybí, budeme tady. Každé pondělí.