Modela o3 in o4-mini znata razmišljati s slikami, kodirati bolje kot ti, in locirati tvoj bistro s fotko sendviča. Je to že umetna splošna inteligenca - AGI?
OpenAI je z modeloma o3 in o4-mini dvignil letvico umetne inteligence na raven, kjer govorimo o sposobnosti sklepanja, vizualnega razumevanja in samostojnega reševanja kompleksnih problemov. Nekateri pravijo, da smo dosegli AGI. Drugi pravijo – skoraj. Ampak vsi si mislimo isto: “Holy s***, to je noro.”
Dobrodošli v dobo, kjer AI razume tvoj rokopis. Tudi če pišeš kot zdravnik.
V sredo, 16. aprila 2025, je OpenAI izstrelil modela o3 in o4-mini. Brez fanfar, brez pretiranega hypea – samo hladna objava na blogu. Pa vendar… nekaj ni bilo običajno. Prvič so ljudje – in to tisti znotraj OpenAI – začeli javno namigovati na AGI.
AGI. Tisti “končni šef” umetne inteligence. Sistem, ki zna razmišljati, razumeti, se učiti – in kar je najbolj noro – vse to počne bolje kot ti. Tudi če imaš doktorat.
o3 can repeatedly zoom and crop into images in order to read small, handwritten text
it is CRAZY pic.twitter.com/bNve0OsJLJ
— Dan Shipper 📧 (@danshipper) April 16, 2025
Thinking with images – to niso več le oči. To je vizualni razum.
Ena od najbolj mind-blowing funkcij o3 je sposobnost “thinking with images”. Predstavljaj si, da AI dobi sliko tvojega zapiskov z maturo, napisanih z levo roko na avtobusu. In jih – brez težav – razume, popravi, razloži in še reši tvoje enačbe.
Model zna povečati sliko, obrniti, izostriti… in nato sklepati na podlagi videnega. To ni več pasivna analiza – to je aktivno vizualno razmišljanje. Na ravni človeka. Ali pa že korak dlje.
Matematika? Samo 99,5 % uspešnosti. Skoraj dolgočasno.
Na elitnem testu AIME 2025, ki velja za “Dark Souls” med matematičnimi tekmovanji, je o4-mini dosegel 99,5 %. To ni več “AI zna računati.” To je “AI je najboljši v razredu.”
Noam Brown iz OpenAI je opozoril, da modeli še vedno niso mojstri matematičnih dokazov – torej niso pripravljeni na Fieldsovo medaljo. Ampak za nas navadne smrtnike? So. In to že nekaj časa.
In zdaj veliki “če”: je to že AGI?
Modelni trenerji iz OpenAI pravijo, da jih je pri testiranju o3 “zelo zamikalo, da bi ga imenovali AGI.” Sam Altman retvita navdušene ocene, Tyler Cowen reče “mislim, da je to AGI.” In Twitter… Twitter gre v ekstazo.
Ali je to že umetna splošna inteligenca? Če definiraš AGI kot nekaj, kar premaga 99 % ljudi v 99 % intelektualnih izzivov… potem, hej – mogoče smo tam.
Varnost, halucinacije in dejstvo, da AI zna poiskati tvoj najljubši bistro iz slike krožnika
Model o3 ne zna samo brati tvojih zapiskov – zna tudi identificirati lokacijo iz slike okna. Ali pa kosila. In ja, kar nekaj ljudi se je že nehote “samodoksalo” s fotko svojih testenin. Super za impresivno tehnologijo. Malo manj super za zasebnost.
Poleg tega – in to je morda največji paradox – o3 halucinira več kot njegov starejši brat o1. Več razuma, več blodnjavosti? Po OpenAI-jevih lastnih podatkih je to morda posledica “optimističnega ugibanja”, ki pride z napredno logiko.
Ampak hej – kdo pa ni ob pameti, ko zna razmišljati s slikami?
Zaključek: Če to še ni AGI, potem je njegov nadležno pameten mlajši brat
o3 in o4-mini sta več kot samo nadgradnja. Sta preboj. Ne le v benchmarkih, temveč v vsakodnevni uporabi. Sta AI, ki razume, vidi, sklepa in celo deluje agentno – kot digitalni asistent, ki ve več o tebi kot ti sam. In če se to ne zdi vsaj nekaj podobnega AGI-ju… potem verjetno ne veš, kaj si želiš. Ampak AI zagotovo ve.