GPT-4.5：欺骗人们认为它是人类的人工智能—

OpenAI实验室的最新人工智能模型GPT-4.5首次成功通过了著名的图灵测试。在最近的一项科学研究中，73 名 % 参与者相信他们正在与真人交流，而不是与算法交流。尽管这是一个令人印象深刻的成就，但它也引发了一些相当可怕的问题。

1950 年，艾伦·图灵提出了一个简单的问题：机器能思考吗？如果他不真正思考，他能说服一个人思考吗？于是著名的图灵测试诞生了——人工智能的终极测试。出色地， GPT-4.5 现在看来，这是历史上第一次，他真正地忍受了这一切。但在我们开始赞扬这台机器之前，让我们先来看看这实际上意味着什么——以及我们为什么会担心。

GPT-4.5 是如何欺骗人类的（或者说它欺骗了人类）？

加州大学圣地亚哥分校的科学家 Cameron Jones 和 Benjamin Bergen 在 arXiv 上发表的一项研究中（来源：arxiv.org）进行了一项实验，参与者试图在 500 次文本对话中判断谁是人类，谁是人工智能。在每次对话中，他们与两位对话者（一位人类和一位人工智能模型）进行互动，并且有整整五分钟的时间来做出决定。

结果？ GPT-4.5 让 73 名 % 测试对象相信这是真人——比实际的人类对话者更成功！如果这都不算数字奇迹，那我们就不知道什么是了。

真人作为对照组参与研究的研究人员成功识别出他们是人类 仅在 67 个 % 病例中.

成功的秘诀是什么？

这不仅仅涉及原始处理能力或理解力。关键在于“角色提示”——用当前的互联网术语来说，这个命令让 GPT-4.5 表现得像一个内向、有点愤世嫉俗的年轻人。看一下他——事实证明，这样的角色似乎完全可信。甚至可能太多了。

其他测试模型的表现则更差：

LLaMa-3.1：56 % 性能
GPT-4o：21 % 性能
伊丽莎 （60 年代的传奇聊天机器人）：23 % 性能

这是否意味着 GPT-4.5 真正具有智能？

不完全是。图灵测试并不衡量意识、理解力或深度智力——它衡量的是模仿的能力。因此，GPT-4.5 学会了如何看起来像人类，但没有学会如何成为人类。或者正如科学家所说：“模型不知道它知道。”这种差异很重要。可以说，GPT-4.5 是一位虚张声势的大师，一位算法世界的魔术师。但这种魔术师如果使用不当，很快就会变成骗子。