fbpx

Tämä viikko tekoälyssä #15/2025: Kun Meta hajosi, Claude voitti ja OpenAI vihdoin avasivat ovensa

Llama 4, jota ei koskaan ollut, Claude Max eliitille ja Copilot tulevaisuuden yhteistyökumppanina

Ta teden v umetni inteligenci
Kuva: Jan Macarol / Ai art

Räjähtävää draamaa Metassa, järkyttävää läpinäkyvyyttä OpenAI:ssa ja kehitystä, joka vie meidät vain kuukausien päähän AGI:sta. Joten - tällä viikolla tekoälyssä.

Jos unohdat tämän viikon tekoälyuutiset, kerromme sinulle vain yhden asian: Minttu hän polvistui (taas), Claudesta tulee toimiston päällikkö, OpenAI on vihdoin omaksunut avoimen lähdekoodin, ja Google kehittää visiotaan keinotekoisesta superassistentista, joka pystyy muokkaamaan videota paremmin kuin sinä. Ja tämä ei ole vitsi. Tämä on tällä viikolla tekoälyssä – numero 15.

#15 tällä viikolla tekoälyssä:
Meta ja Llama 4 -katastrofi

Llama 4:n piti olla Metan tekoälykehityksen kruununjalokivi, mutta lopputulos on pettymys. Yleisölle esitelty malli ei ole se, joka osallistui vertailuihin ja teki vaikutuksen. Tämän huomasi ensimmäisenä professori Ethan Mollick, joka vahvisti, että LLM-areenalla julkaistun mallin tulokset eivät vastanneet julkisen version tuloksia. (lähde: x.com/ethanmollick)

Sen jälkeen Redditissä ilmestyi viestejä entisiltä Meta-työntekijöiltä, jotka työskentelevät nyt OpenAI:ssa ja irtautuivat avoimesti Llama 4:stä. Yksi heistä kirjoitti profiilissaan: "Laama 2 ja Llama 3, Llama 4? Minulla ei ole mitään tekemistä sen kanssa." (lähde: reddit.com)

Lisäksi on tullut ilmi, että Metan tekoälydivisioonan sisäinen järkytys laukesi, kun tuntematon ja pienen budjetin kiinalainen malli DeepSeek V3 ohitti heidät vertailuissa. Yritykselle, joka investoi miljardeja tekoälyn kehittämiseen, tämä ei ole pieni saavutus.

Claude Max ja ennusteet Claude 4:stä

Anthropic yllätti uudella palvelulla tällä viikolla Claude Max – Tilauspaketti vaativille käyttäjille, joka tarjoaa viidestä kahteenkymmeneen kertaan suuremman vuorovaikutuskiintiön, etuoikeutetun pääsyn uusimpiin malleihin ja ominaisuuksiin. (lähde: anthropic.com)

Samaan aikaan Jared Kaplan, Anthropicin päätutkija, ilmoitti, että näemme Claude 4:n seuraavan kuuden kuukauden sisällä. Hänen mukaansa tekoälymallien kehitys on nopeampaa kuin laitteiston kehitys, mikä johtuu pääasiassa nopeutetusta jälkikoulutuksesta ja vahvistusoppimisen parannuksista. Yksi hienovaraisimmista mutta tärkeimmistä uutisista tällä viikolla tekoälyssä.

OpenAI julkistaa vihdoin avoimen lähdekoodin mallin

Vuosia kestäneen kritiikin jälkeen läpinäkyvyyden puutteesta ja etääntymisestä alkuperäisestä tehtävästään, Sam Altman ilmoitti, että OpenAI julkaisee pian avoimen lähdekoodin mallin, joka ylittää kaikki olemassa olevat vaihtoehdot. (lähde: openai.com)

Lisäksi ChatGPT:llä on nyt pitkäkestoinen muisti, joka mahdollistaa aiempien vuorovaikutusten käyttämisen kokemusten personointiin ja antaa käyttäjälle mahdollisuuden saada tekoäly aktiivisesti seuraamaan tavoitteitaan ja ohjaamaan heitä ajatusmallien yhteensopimattomuudesta.

Mutta kaikki ei ole niin ruusuista: lyhennetty tietoturvatestaus OpenAI:ssa

Financial Times paljasti, että OpenAI on vähentänyt merkittävästi malliensa turvallisuuden testaamiseen kuluvaa aikaa ja laajuutta. Useiden viikkojen sijaan heillä on nyt vain muutama päivä, mikä herättää huolta siitä, että malleja voidaan julkaista julkisesti, jos niissä on havaitsemattomia haavoittuvuuksia. Entinen testiinsinööri kertoi FT:lle, että GPT-4:n vaarat havaittiin vasta kaksi kuukautta sen julkaisun jälkeen. (lähde: ft.com)

Syynä sanotaan olevan yksinkertainen – kilpailupaine. Yritykset kiirehtivät esittelemään uusia malleja, jotta ne eivät jää jälkeen. Ja vaikka nämä ovat aikamme tehokkaimpia työkaluja, turvallisuus työnnetään marginaaleille.

DeepCode 14B: OpenAI:n avoimen lähdekoodin kilpailija

DeepSeek ja Aentica esiteltiin DeepCode 14B, avoimen lähdekoodin malli ohjelmistokoodin luomiseen. Vain 14 miljardilla parametrilla se saavuttaa kaupallisiin GPT-3.5-malleihin verrattavia tuloksia. He kouluttivat sitä yli 24 000 ainutlaatuisessa tehtävässä ja käyttivät GRPO+ -menetelmää, joka palkitsee mallin vain täydellisestä ratkaisusta. (lähde: github.com/aentica)

BrowseComp: Uusi liiga tekoälyagenteille

OpenAI on ottanut käyttöön BrowseComp, vertailukohta tekoälyagenteille, jotka voivat selata verkkoa tehokkaasti ja etsiä monimutkaista tietoa. Se on tarkoitettu testaamaan malleja, joiden on selattava kymmeniä sivuja päästäkseen asiaankuuluviin tietoihin. (lähde: github.com/openai/simple-evals)

Google johtaa peliä

Google julkistaa sulautumissuunnitelmat Kaksoset ja Vio mallit – tekstin, kuvan ja äänen ymmärtäminen videoiden luomisen avulla. Heidän tavoitteenaan on luoda multimodaalinen superassistentti, joka ymmärtää maailmaa kuten mekin. (lähde: googlecloudnext.com)

Lisäksi Google esitteli uuden sukupolven AI-siruja TPU Ironwood, joka on 3600 kertaa tehokkaampi kuin vuoden 2018 ensimmäinen sukupolvi. Tämän ansiosta he voivat kouluttaa suurempia malleja ja ajaa niitä nopeammin ilman Nvidiaa.

Microsoft Copilotista on tulossa vakava kilpailija

Microsoftin Lentoperämies Siinä on uusittu käyttöliittymä, asunnonhakuominaisuudet, apu kirjeiden kirjoittamiseen ja jopa kuvankäsittelyominaisuudet. Se toimii reaaliaikaisena henkilökohtaisena avustajana, jolla on pääsy näyttöön ja kontekstiin. (lähde: microsoft.com)

Microsoft AI:n johtaja Mustafa Suleyman uskoo, että AGI saattaa olla täällä viiden vuoden sisällä, vaikka hän myöntää, että perusongelmia – kuten hallusinaatioita ja huonoa ohjeiden noudattamista – ei ole vielä ratkaistu.

Midjourney v7: upeita kuvia, mutta silti ei tekstiä

Midjourney on julkaissut kuvantamismallinsa seitsemännen sukupolven, joka tekee vaikutuksen hyperrealismilla. Tekstin luominen on kuitenkin edelleen paljon jäljessä, kuten he itse myöntävät – käyttäjät tuskin käyttävät sitä, joten se ei ole prioriteetti. (lähde: midjourney.com)

Neo robotti toimii livenä

Robotti alusta 1X Neo on osoittanut, että hän voi suorittaa suoria tehtäviä itsenäisesti. Tämä ei ole vain yksi PR-temppu; robotti liikkui, siivosi, toimi ilman skriptejä. Sen muotoilu sisältää keinotekoisia lihaksia ja liikkuvuutta, mikä mahdollistaa sen turvallisen olemassaolon ihmisten kanssa. (lähde: 1x.tech)

Tekoälytutkija kirjoittaa ensimmäisen ammatillisen artikkelin

Sakana AI Labs ilmoitti, että heidän mallinsa on kirjoittanut ensimmäisen tieteellisen artikkelin, joka on läpäissyt vertaisarvioinnin työpajassa. Tekoäly muotoili hypoteesin, analysoi tiedot ja teki johtopäätökset – ilman ihmisen apua. (lähde: sakana.ai)


Johtopäätös

Vain viikossa näimme Metan vision romahtamisen, avoimen lähdekoodin mallien kiihtymisen, vaarallisia suuntauksia tietoturvatestauksessa ja uuden sukupolven multimodaalisia agentteja. Tekoälyn maailma ei vain kehity nopeasti – se kehittyy suuntaan, joka tuntui tieteiskirjallisuudesta vielä vuosi sitten.

Ensi viikko lupaa vielä enemmän. Jos unohdat jotain, olemme täällä. Joka maanantai.

Kanssasi vuodesta 2004

Vuodesta alkaen 2004 tutkimme kaupunkitrendejä ja tiedotamme seuraajayhteisöllemme päivittäin viimeisimmistä elämäntavoista, matkustamisesta, tyylistä ja tuotteista, jotka inspiroivat intohimoa. Vuodesta 2023 alkaen tarjoamme sisältöä suurimmilla maailmanlaajuisilla kielillä.