o3 和 o4-mini 型号可以通过图像思考,比您更好地编码,并可以通过三明治照片找到您的小酒馆。这已经是通用人工智能——AGI了吗?
通过 o3 和 o4-mini 模型,OpenAI 将人工智能的标准提升到了推理、视觉理解和独立解决复杂问题的能力水平。有人说我们已经实现了AGI。其他人则说——差不多。但我们都在想同一件事:“天啊,这太疯狂了。”
欢迎来到人工智能能够理解您的笔迹的时代。即使你的写作风格像医生一样。
2025 年 4 月 16 日星期三,OpenAI 推出了该模型 臭氧 和 o4-迷你。没有大张旗鼓,没有过度炒作——只是一篇很酷的博客文章。然而……有些事情不正常。这是人们(包括 OpenAI 内部人员)第一次公开暗示 AGI。
通用人工智能。人工智能的“最终BOSS”。一个能够思考、理解、学习的系统——最疯狂的是——它比你做得更好。即使你拥有博士学位。
o3 可以反复缩放和裁剪图像,以便阅读小的手写文字
这太疯狂了 pic.twitter.com/bNve0OsJLJ
— 丹·希珀📧 (@danshipper) 2025年4月16日
用图像思考——不再只是用眼睛。这就是视觉智能。
o3 最令人惊叹的功能之一是“用图像思考”的能力。想象一下,人工智能拍下了你在公交车上用左手写的高中成绩单。它可以理解、纠正、解释甚至解决您的方程式——没有任何问题。
该模型可以放大、旋转、锐化图像……然后根据所看到的内容得出结论。这不再是被动的分析——这是主动的视觉思维。在人类层面。甚至更进一步。
数学? %成功率仅为99.5。几乎无聊。
在被认为是数学竞赛“黑暗之魂”的精英 AIME 2025 测试中,o4-mini 获得了 99.5 % 的成绩。这不再是“AI可以计算”。这就是“人工智能是同类中最好的”。
OpenAI 的 Noam Brown 警告说,这些模型仍然不是数学证明的大师——也就是说,它们还没有准备好获得菲尔兹奖。但对于我们这些凡人来说呢?是的。这种情况已经持续了一段时间了。
现在最大的问题是“如果”:这是 AGI 吗?
OpenAI 的模型训练师表示,在测试 o3 时,他们“非常想将其称为 AGI”。 Sam Altman 转发了热烈的评论,Tyler Cowen 说“我认为这就是 AGI”。还有 Twitter...Twitter 陷入狂喜。
这已经是通用人工智能了吗?如果你将 AGI 定义为在 99 % 智力挑战中击败 99 % 人类的东西……那么,嘿——也许我们已经做到了。
安全、幻觉,以及人工智能可以通过盘子图片找到你最喜欢的小酒馆
o3 模型不仅可以读取您的笔记 - 它还可以根据窗口的图片识别位置。或者午餐。是的,已经有不少人不经意间用他们的意大利面照片“自嘲”过。非常适合令人印象深刻的技术。对于隐私来说,有点不太好。
此外——这也许是最大的悖论——o3 比他的哥哥 o1 产生更多的幻觉。理性越多,妄想越多?根据OpenAI自己的数据,这或许是源于高级逻辑所带来的“乐观猜测”。
但是嘿——当他们能够用图像思考时,谁不是理智的呢?
结论:如果这不是 AGI,那么它就是 AGI 的恼人小兄弟
o3 和 o4-mini 不仅仅是升级。它们是一个突破。不仅在基准测试中,而且在日常使用中。它们是能够理解、观察、推理,甚至代理行动的人工智能——就像比你更了解你的数字助理。如果这看起来不像至少 类似的东西 AGI……那么你可能不知道自己想要什么。但人工智能肯定知道。