O3- og o4-mini-modellene kan tenke i bilder, kode bedre enn deg og finne bistroen din med et bilde av en sandwich. Er dette allerede kunstig generell intelligens - AGI?
Med o3- og o4-mini-modellene har OpenAI hevet baren for kunstig intelligens til et nivå der vi snakker om evnen til å resonnere, visuell forståelse og selvstendig løse komplekse problemer. Noen sier at vi har oppnådd AGI. Andre sier – nesten. Men vi tenker alle det samme: "Hellige jævla, dette er galskap."
Velkommen til epoken hvor AI forstår håndskriften din. Selv om du skriver som en lege.
Onsdag 16. april 2025 lanserte OpenAI modellen o3 og o4-mini. Ingen fanfare, ingen overdreven hype – bare et kult blogginnlegg. Og likevel... noe var ikke normalt. For første gang begynte folk – og de innen OpenAI – offentlig å hinte om AGI.
AGI. Den "endelige sjefen" for kunstig intelligens. Et system som kan tenke, forstå, lære – og det som er galeste – gjør alt bedre enn deg. Selv om du har en doktorgrad.
o3 kan gjentatte ganger zoome og beskjære til bilder for å lese liten, håndskrevet tekst
det er GALT pic.twitter.com/bNve0OsJLJ
— Dan Shipper 📧 (@danshipper) 16. april 2025
Å tenke med bilder – det er ikke bare øynene lenger. Dette er visuell intelligens.
En av de mest oppsiktsvekkende funksjonene til o3 er evnen til å "tenke med bilder". Se for deg en AI som får et bilde av avskriftene dine fra videregående skrevet med venstre hånd på bussen. Og den forstår, korrigerer, forklarer og løser til og med ligningene dine – uten problemer.
Modellen kan zoome inn på bildet, rotere det, gjøre det skarpere... og så trekke konklusjoner basert på det den ser. Dette er ikke lenger passiv analyse – dette er aktiv visuell tenkning. På det menneskelige plan. Eller til og med et skritt videre.
Matematikk? Kun 99,5 % suksessrate. Nesten kjedelig.
På elite-AIME 2025-testen, ansett som "Dark Souls" i matematikkkonkurranser, fikk o4-mini-en 99,5 %. Dette er ikke lenger "AI kan beregne." Dette er "AI er best i klassen."
Noam Brown fra OpenAI advarte om at modellene fortsatt ikke er mestere i matematiske bevis – det vil si at de ikke er klare for Fields-medaljen. Men for oss bare dødelige? Det er de. Og det har det vært en stund.
Og nå det store "hvis": er dette AGI?
Modelltrenere hos OpenAI sier at når de testet o3, ble de "veldig fristet til å kalle det AGI." Sam Altman retweeter strålende anmeldelser, Tyler Cowen sier "Jeg tror dette er AGI." Og Twitter ... Twitter går i ekstase.
Er dette allerede kunstig generell intelligens? Hvis du definerer AGI som noe som slår 99 %-mennesker i 99 % intellektuelle utfordringer … så, hei – kanskje vi er der.
Sikkerhet, hallusinasjoner og det faktum at AI kan finne din favorittbistro fra et bilde av en tallerken
O3-modellen kan ikke bare lese notatene dine - den kan også identifisere plasseringen fra et bilde av vinduet. Eller lunsjer. Og ja, ganske mange mennesker har allerede utilsiktet "selvfordømt" med et bilde av pastaen deres. Flott for imponerende teknologi. Litt mindre bra for privatliv.
Dessuten – og dette er kanskje det største paradokset – hallusinerer o3 mer enn sin eldre bror o1. Mer grunn, mer vrangforestilling? I følge OpenAIs egne data kan dette skyldes den «optimistiske gjetningen» som følger med avansert logikk.
Men hei – hvem er ikke tilregnelig når de kan tenke i bilder?
Konklusjon: Hvis dette ikke er AGI, så er det dens irriterende smarte lillebror
O3 og o4-mini er mer enn bare en oppgradering. De er et gjennombrudd. Ikke bare i benchmarks, men i daglig bruk. De er AI som forstår, ser, trekker slutninger og til og med opptrer agent – som en digital assistent som vet mer om deg enn deg. Og hvis det ikke virker slik i det minste noe lignende AGI... da vet du sannsynligvis ikke hva du vil. Men AI vet sikkert.