fbpx

Tento týždeň v umelej inteligencii #15/2025: Keď sa Meta rozpadla, Claude vyhral a OpenAI konečne otvorili svoje brány

Llama 4, ktorá nikdy nebola, Claude Max pre elitu a Copilot ako spolupracovník budúcnosti

Ta teden v umetni inteligenci
Foto: Jan Macarol / Ai art

Výbušná dráma v Meta, šokujúca transparentnosť v OpenAI a vývoj, ktorý nás od AGI delí len niekoľko mesiacov. Takže – tento týždeň v umelej inteligencii.

Ak ste tento týždeň zmeškali novinky o AI, povieme vám len jednu vec: mäta pokľakla (opäť), Claude sa stane vedúcim kancelárie, OpenAI konečne prijíma open source a Google rozvíja svoju víziu umelého super asistenta, ktorý dokáže upravovať video lepšie ako vy. A to nie je vtip. Toto je tento týždeň v umelej inteligencii – vydanie 15.

#15 tento týždeň v umelej inteligencii:
Meta and the Llama 4 katastrofa

Llama 4 mala byť korunným klenotom vývoja AI spoločnosti Meta, ale konečný výsledok je sklamaním. Model, ktorý bol predstavený verejnosti, nie je ten, ktorý sa zúčastnil na benchmarkoch a zaujal. Prvýkrát si to všimol profesor Ethan Mollick, ktorý potvrdil, že výsledky modelu zverejnené v LLM-aréne sa nezhodujú s tými, ktoré dosiahla verejná verzia. (zdroj: x.com/ethanmollick)

Na Reddite sa potom objavili príspevky od bývalých zamestnancov Meta, ktorí teraz pracujú v OpenAI, pričom sa otvorene dištancovali od Llama 4. Jeden z nich napísal do svojho profilu: "Llama 2 a Llama 3, Llama 4? Nemám s tým nič spoločné." (zdroj: reddit.com)

Okrem toho sa objavili informácie, že vnútorné otrasy v divízii AI spoločnosti Meta sa spustili, keď ich v benchmarkoch predbehol neznámy a nízkorozpočtový čínsky model DeepSeek V3. Pre spoločnosť, ktorá investuje miliardy do vývoja umelej inteligencie, to nie je maličkosť.

Claude Max a predpovede o Claude 4

Antropic tento týždeň prekvapil novou službou Claude Max – plán predplatného pre náročných používateľov, ktorý ponúka päť až dvadsaťnásobok interakčnej kvóty, prioritný prístup k najnovším modelom a funkciám. (zdroj: anthropic.com)

Medzitým Jared Kaplan, hlavný vedec v Anthropic, oznámil, že Claude 4 uvidíme v priebehu nasledujúcich šiestich mesiacov. Vývoj modelov AI podľa neho prebieha rýchlejšie ako vývoj hardvéru, a to najmä vďaka zrýchlenému post-tréningu a zlepšeniam v posilňovacom učení. Jedna z jemných, ale hlavných správ tohto týždňa v oblasti umelej inteligencie.

OpenAI konečne oznamuje open source model

Po rokoch kritiky za nedostatočnú transparentnosť a dištancovanie sa od svojho pôvodného poslania Sam Altman oznámil, že OpenAI čoskoro vydá open-source model, ktorý prekoná všetky existujúce alternatívy. (zdroj: openai.com)

ChatGPT má teraz navyše dlhodobú pamäť, ktorá umožňuje použiť minulé interakcie na prispôsobenie skúseností a umožňuje používateľovi nechať AI aktívne sledovať svoje ciele a viesť ich cez nekompatibilitu v myšlienkových vzorcoch.

Ale nie všetko je také ružové: skrátené bezpečnostné testovanie v OpenAI

Peňažné časy odhalil, že OpenAI výrazne skrátila čas a rozsah testovania bezpečnosti svojich modelov. Namiesto niekoľkých týždňov majú teraz len pár dní, čo vyvoláva obavy, že modely môžu byť zverejnené s neobjavenými zraniteľnosťami. Bývalý testovací inžinier pre FT povedal, že nebezpečenstvo GPT-4 bolo objavené len dva mesiace po jeho vydaní. (zdroj: ft.com)

Dôvod je vraj jednoduchý – konkurenčný tlak. Spoločnosti sa ponáhľajú s predstavovaním nových modelov, aby nezaostali. A hoci ide o najsilnejšie nástroje našej doby, bezpečnosť je vytláčaná na okraj.

DeepCode 14B: open-source konkurent OpenAI

Predstavené DeepSeek a Aentica DeepCode 14B, model s otvoreným zdrojovým kódom na generovanie softvérového kódu. Len s 14 miliardami parametrov dosahuje výsledky porovnateľné s komerčnými modelmi GPT-3.5. Trénovali ho viac ako 24 000 unikátnymi úlohami a použili metódu GRPO+, ktorá model odmeňuje len za dokonalé riešenie. (zdroj: github.com/aentica)

BrowseComp: Nová liga pre AI agentov

OpenAI predstavila BrowseComp, benchmark pre agentov AI, ktorí dokážu efektívne prehliadať web a vyhľadávať komplexné informácie. Je určený na testovanie modelov, ktoré musia prelistovať desiatky strán, aby sa dostali k relevantným informáciám. (zdroj: github.com/openai/simple-evals)

Google vedie hru

Google odhaľuje plány fúzií Blíženci a Vio modely – porozumenie textu, obrazu a zvuku s generovaním videa. Ich cieľom je vytvoriť multimodálneho super asistenta, ktorý rozumie svetu ako my. (zdroj: googlecloudnext.com)

Okrem toho Google predstavil novú generáciu AI čipov TPU Ironwood, ktorý je 3600-krát výkonnejší ako prvá generácia z roku 2018. To im umožňuje trénovať väčšie modely a spúšťať ich rýchlejšie bez závislosti od Nvidie.

Microsoft Copilot sa stáva vážnym konkurentom

spoločnosti Microsoft Druhý pilot Má prepracované rozhranie, funkcie vyhľadávania bytov, pomoc pri písaní listov a dokonca aj možnosti úpravy obrázkov. Funguje ako osobný asistent v reálnom čase s prístupom k obrazovke a kontextu. (zdroj: microsoft.com)

Mustafa Suleyman, šéf Microsoft AI, verí, že AGI by tu mohol byť do piatich rokov, aj keď uznáva, že základné problémy – ako sú halucinácie a zlé dodržiavanie pokynov – ešte neboli vyriešené.

Midjourney v7: úžasné obrázky, ale stále bez textu

Midjourney vydalo siedmu generáciu svojho zobrazovacieho modelu, ktorý zaujme hyperrealizmom. Generovanie textu však stále výrazne zaostáva, ako sami priznávajú – používatelia ho takmer nepoužívajú, takže nie je prioritou. (zdroj: midjourney.com)

Neo robot pracuje naživo

Robotická platforma 1X Neo ukázala, že dokáže samostatne vykonávať živé úlohy. Toto nie je len ďalší PR trik; robot sa pohyboval, čistil, fungoval bez skriptov. Jeho dizajn zahŕňa umelé svaly a pohyblivosť, ktorá mu umožňuje bezpečne koexistovať s ľuďmi. (zdroj: 1x.tech)

AI vedec píše prvý odborný článok

Sakana AI Labs oznámili, že ich model napísal prvý vedecký článok, ktorý prešiel odborným hodnotením na workshope. AI sformulovala hypotézu, analyzovala údaje a vyvodila závery – bez ľudskej pomoci. (zdroj: sakana.ai)


Záver

Len za týždeň sme boli svedkami kolapsu vízie Meta, zrýchlenia open source modelov, nebezpečných trendov v testovaní bezpečnosti a novej generácie multimodálnych agentov. Svet umelej inteligencie sa nielen rýchlo vyvíja, ale aj smerom, ktorý sa ešte pred rokom zdal ako sci-fi.

Budúci týždeň sľubuje ešte viac. Ak vám niečo chýba, sme tu. Každý pondelok.

S vami od roku 2004

Od r 2004 skúmame mestské trendy a denne informujeme našu komunitu sledovateľov o najnovšom životnom štýle, cestovaní, štýle a produktoch, ktoré inšpirujú vášňou. Od roku 2023 ponúkame obsah v hlavných svetových jazykoch.