Die Modelle o3 und o4-mini können in Bildern denken, besser programmieren als Sie und Ihr Bistro anhand eines Sandwich-Fotos lokalisieren. Handelt es sich hierbei bereits um künstliche allgemeine Intelligenz – AGI?
Mit den Modellen o3 und o4-mini hat OpenAI die Messlatte der künstlichen Intelligenz auf ein Niveau gelegt, auf dem es um die Fähigkeit zum logischen Denken, zum visuellen Verständnis und zur selbstständigen Lösung komplexer Probleme geht. Manche sagen, wir hätten AGI erreicht. Andere sagen – fast. Aber wir denken alle dasselbe: „Heilige Scheiße, das ist verrückt.“
Willkommen im Zeitalter, in dem KI Ihre Handschrift versteht. Auch wenn Sie wie ein Arzt schreiben.
Am Mittwoch, dem 16. April 2025, startete OpenAI das Modell o3 und o4-mini. Kein Tamtam, kein übertriebener Hype – einfach nur ein cooler Blogbeitrag. Und dennoch … war etwas nicht normal. Zum ersten Mal begannen Menschen – auch innerhalb von OpenAI – öffentlich auf AGI hinzuweisen.
AGI. Dieser „Endgegner“ der künstlichen Intelligenz. Ein System, das denken, verstehen, lernen kann – und – was am verrücktesten ist – alles besser macht als Sie. Auch wenn Sie promoviert sind.
o3 kann Bilder wiederholt vergrößern und zuschneiden, um kleinen, handgeschriebenen Text zu lesen
es ist VERRÜCKT pic.twitter.com/bNve0OsJLJ
— Dan Shipper 📧 (@danshipper) 16. April 2025
Denken mit Bildern – es sind nicht mehr nur die Augen. Das ist visuelle Intelligenz.
Eine der umwerfendsten Funktionen von o3 ist die Fähigkeit, „mit Bildern zu denken“. Stellen Sie sich vor, eine KI würde im Bus ein Foto Ihrer Highschool-Zeugnisse machen, die Sie mit der linken Hand geschrieben haben. Und es versteht, korrigiert, erklärt und löst sogar Ihre Gleichungen – ohne Probleme.
Das Modell kann das Bild vergrößern, drehen, schärfen … und dann auf Grundlage dessen, was es sieht, Schlussfolgerungen ziehen. Dies ist keine passive Analyse mehr, sondern aktives visuelles Denken. Auf menschlicher Ebene. Oder sogar noch einen Schritt weiter.
Mathematik? Nur 99,5 %-Erfolgsrate. Fast langweilig.
Beim Elitetest AIME 2025, der als „Dark Souls“ der Mathematikwettbewerbe gilt, erreichte der o4-mini 99,5 %. Es heißt nicht mehr „KI kann rechnen“. Dies ist „KI ist die Beste ihrer Klasse.“
Noam Brown von OpenAI warnte, dass die Modelle noch immer keine Meister der mathematischen Beweise seien – das heißt, sie seien noch nicht bereit für die Fields-Medaille. Aber für uns Normalsterbliche? Sie sind. Und das schon seit einiger Zeit.
Und jetzt das große „Wenn“: Ist das AGI?
Modelltrainer bei OpenAI sagen, dass sie beim Testen von o3 „sehr versucht waren, es AGI zu nennen.“ Sam Altman retweetet begeisterte Kritiken, Tyler Cowen sagt: „Ich denke, das ist AGI.“ Und Twitter … Twitter gerät in Ekstase.
Handelt es sich hierbei bereits um künstliche allgemeine Intelligenz? Wenn Sie AGI als etwas definieren, das 99 % Menschen in 99 % intellektuellen Herausforderungen schlägt … dann, hey – vielleicht sind wir da.
Sicherheit, Halluzinationen und die Tatsache, dass KI Ihr Lieblingsbistro anhand eines Tellerbilds finden kann
Das Modell o3 kann nicht nur Ihre Notizen lesen, sondern auch den Standort anhand eines Bildes des Fensters identifizieren. Oder Mittagessen. Und ja, so mancher hat sich mit einem Foto seiner Pasta schon unabsichtlich „selbstironisch“ dargestellt. Großartig für beeindruckende Technologie. Etwas weniger toll für die Privatsphäre.
Darüber hinaus – und das ist vielleicht das größte Paradox – halluziniert o3 mehr als sein älterer Bruder o1. Mehr Vernunft, mehr Wahn? Laut den eigenen Daten von OpenAI kann dies an der „optimistischen Vermutung“ liegen, die mit fortgeschrittener Logik einhergeht.
Aber hey – wer ist nicht vernünftig, wenn er in Bildern denken kann?
Fazit: Wenn das keine AGI ist, dann ist es ihr nervig intelligenter kleiner Bruder
Der o3 und der o4-mini sind mehr als nur ein Upgrade. Sie sind ein Durchbruch. Nicht nur in Benchmarks, sondern auch im Alltagsgebrauch. Es handelt sich um KI, die versteht, sieht, Schlussfolgerungen zieht und sogar handlungsfähig ist – wie ein digitaler Assistent, der mehr über Sie weiß als Sie selbst. Und wenn das nicht so scheint, etwas Ähnliches AGI... dann wissen Sie wahrscheinlich nicht, was Sie wollen. Aber die KI weiß es mit Sicherheit.