OpenAI 的 o3 革命：OpenAI 可能无意中发布了 AGI。这是人工智能变得比我们更聪明的时刻吗？ |城市杂志

o3 和 o4-mini 型号可以通过图像思考，比您更好地编码，并可以通过三明治照片找到您的小酒馆。这已经是通用人工智能——AGI了吗？

通过 o3 和 o4-mini 模型，OpenAI 将人工智能的标准提升到了推理、视觉理解和独立解决复杂问题的能力水平。有人说我们已经实现了AGI。其他人则说——差不多。但我们都在想同一件事：“天啊，这太疯狂了。”

欢迎来到人工智能能够理解您的笔迹的时代。即使你的写作风格像医生一样。

2025 年 4 月 16 日星期三，OpenAI 推出了该模型臭氧和 o4-迷你。没有大张旗鼓，没有过度炒作——只是一篇很酷的博客文章。然而……有些事情不正常。这是人们（包括 OpenAI 内部人员）第一次公开暗示 AGI。

通用人工智能。人工智能的“最终BOSS”。一个能够思考、理解、学习的系统——最疯狂的是——它比你做得更好。即使你拥有博士学位。

o3 可以反复缩放和裁剪图像，以便阅读小的手写文字

这太疯狂了 pic.twitter.com/bNve0OsJLJ

— 丹·希珀📧 (@danshipper) 2025年4月16日

o3 最令人惊叹的功能之一是“用图像思考”的能力。想象一下，人工智能拍下了你在公交车上用左手写的高中成绩单。它可以理解、纠正、解释甚至解决您的方程式——没有任何问题。

该模型可以放大、旋转、锐化图像……然后根据所看到的内容得出结论。这不再是被动的分析——这是主动的视觉思维。在人类层面。甚至更进一步。

在被认为是数学竞赛“黑暗之魂”的精英 AIME 2025 测试中，o4-mini 获得了 99.5 % 的成绩。这不再是“AI可以计算”。这就是“人工智能是同类中最好的”。

OpenAI 的 Noam Brown 警告说，这些模型仍然不是数学证明的大师——也就是说，它们还没有准备好获得菲尔兹奖。但对于我们这些凡人来说呢？是的。这种情况已经持续了一段时间了。

OpenAI 的模型训练师表示，在测试 o3 时，他们“非常想将其称为 AGI”。 Sam Altman 转发了热烈的评论，Tyler Cowen 说“我认为这就是 AGI”。还有 Twitter...Twitter 陷入狂喜。

这已经是通用人工智能了吗？如果你将 AGI 定义为在 99 % 智力挑战中击败 99 % 人类的东西……那么，嘿——也许我们已经做到了。

o3 模型不仅可以读取您的笔记 - 它还可以根据窗口的图片识别位置。或者午餐。是的，已经有不少人不经意间用他们的意大利面照片“自嘲”过。非常适合令人印象深刻的技术。对于隐私来说，有点不太好。

此外——这也许是最大的悖论——o3 比他的哥哥 o1 产生更多的幻觉。理性越多，妄想越多？根据OpenAI自己的数据，这或许是源于高级逻辑所带来的“乐观猜测”。

但是嘿——当他们能够用图像思考时，谁不是理智的呢？

o3 和 o4-mini 不仅仅是升级。它们是一个突破。不仅在基准测试中，而且在日常使用中。它们是能够理解、观察、推理，甚至代理行动的人工智能——就像比你更了解你的数字助理。如果这看起来不像至少 类似的东西 AGI……那么你可能不知道自己想要什么。但人工智能肯定知道。