fbpx

GPT-4.5:欺骗人们认为它是人类的人工智能——以及图灵测试

GPT-4.5
照片:Jan Macarol / Ai art

OpenAI实验室的最新人工智能模型GPT-4.5首次成功通过了著名的图灵测试。在最近的一项科学研究中,73 名 % 参与者相信他们正在与真人交流,而不是与算法交流。尽管这是一个令人印象深刻的成就,但它也引发了一些相当可怕的问题。

1950 年,艾伦·图灵提出了一个简单的问题:机器能思考吗?如果他不真正思考,他能说服一个人思考吗?于是著名的图灵测试诞生了——人工智能的终极测试。出色地, GPT-4.5 现在看来,这是历史上第一次,他真正地忍受了这一切。但在我们开始赞扬这台机器之前,让我们先来看看这实际上意味着什么——以及我们为什么会担心。

GPT-4.5 是如何欺骗人类的(或者说它欺骗了人类)?

加州大学圣地亚哥分校的科学家 Cameron Jones 和 Benjamin Bergen 在 arXiv 上发表的一项研究中(来源:arxiv.org)进行了一项实验,参与者试图在 500 次文本对话中判断谁是人类,谁是人工智能。在每次对话中,他们与两位对话者(一位人类和一位人工智能模型)进行互动,并且有整整五分钟的时间来做出决定。

结果? GPT-4.5 让 73 名 % 测试对象相信这是真人——比实际的人类对话者更成功!如果这都不算数字奇迹,那我们就不知道什么是了。

真人作为对照组参与研究的研究人员成功识别出他们是人类 仅在 67 个 % 病例中.

成功的秘诀是什么?

这不仅仅涉及原始处理能力或理解力。关键在于“角色提示”——用当前的互联网术语来说,这个命令让 GPT-4.5 表现得像一个内向、有点愤世嫉俗的年轻人。看一下他——事实证明,这样的角色似乎完全可信。甚至可能太多了。

其他测试模型的表现则更差:

  • LLaMa-3.1:56 % 性能
  • GPT-4o:21 % 性能
  • 伊丽莎 (60 年代的传奇聊天机器人):23 % 性能
GPT-4.5
照片:Jan Macarol / Ai art

这是否意味着 GPT-4.5 真正具有智能?

不完全是。图灵测试并不衡量意识、理解力或深度智力——它衡量的是模仿的能力。因此,GPT-4.5 学会了如何看起来像人类,但没有学会如何成为人类。或者正如科学家所说:“模型不知道它知道。”这种差异很重要。可以说,GPT-4.5 是一位虚张声势的大师,一位算法世界的魔术师。但这种魔术师如果使用不当,很快就会变成骗子。

我们为什么要担心这个?

如果人工智能模仿人类的能力比人类自身更强,那么这对于在线身份验证、人际关系、操纵舆论意味着什么?人工智能未来可以撰写专栏、进行采访并说服选民吗?

研究人员强调,社会需要认真考虑如何规范这种强大的模型。目前,任何人都可以生成令人信服的虚假对话、评论、观点……而且,只需点击几下,谁知道接下来还会发生什么。


结论:我们已经拥有AGI了吗?

GPT-4.5 不仅仅是另一个智能聊天机器人。这是一个里程碑。这证明我们已经进入了一个新时代——在这个时代,机器不仅能理解语言,还能巧妙地运用语言,甚至能欺骗我们。

这太有趣了。这太可怕了。这就是未来。

看来,未来将会非常美好。

自2004年以来与您同在

从年 2004 我们研究城市趋势,并每天向我们的追随者社区通报最新的生活方式、旅行、风格和激发激情的产品。从 2023 年开始,我们将提供全球主要语言的内容。