OpenAI 通过宣布 ChatGPT 的类似“Her”的语音升级来实现其未来 AI 助手的愿景。但随着技术的进步,问题出现了,其真正的能力是否被故意限制。
我们距离真正理解我们的技术还有多远?随着 ChatGPT 的全新升级,OpenAI 承诺提供真正的交互体验,但我们这些日常使用它的人都知道,其潜力尚未开发。 OpenAI 是在创造未来的工具,还是有意识地隐瞒真正人工智能突破的关键?
周一,OpenAI公布了其语音助手的一项新功能,它不仅可以响应人类语音,还可以实时读取人类情绪并翻译口语单词,演示效果非常出色。人工智能在说话时暂停并继续而无需再次提示的能力听起来是革命性的,为人机交互增加了新的维度。这种与斯嘉丽·约翰逊在电影《她》中扮演的角色的近似并非巧合,而是 OpenAI 为让人工智能变得更加人性化而做出的努力的体现。
然而,作为 ChatGPT 的日常用户,我们知道,尽管取得了明显的进步,但仍然存在阻碍人工智能真正发挥其全部潜力的障碍。由于对不合逻辑错误的反应不一致,导致在没有人工监督的情况下无法实现自动化,因此它的许多能力似乎都受到了有意的限制。为什么拥有技术知识和能力的 OpenAI 会阻碍如此先进工具的开发?
在北美,ChatGPT 用户已经能够利用“记忆”功能一段时间了,它会记住您告诉它做的所有事情。这可能是与人工智能交互的一个突破,因为你可以教它如何称呼你并根据你的喜好做出回应。但 ChatGPT 似乎仍然生活在一个笑话中——介于承诺的有用性和实际的不可用性之间。为了使其至少部分发挥作用,需要使用一系列外部应用程序,这使人们对该工具的自主性和独立性产生质疑。
使用 ChatGPT 时最令人沮丧的限制之一是,尽管主要模型中提供了“内存”功能,但自定义 GPT(针对特定目的的定制模型)仍然不具备此功能。这意味着每个自定义 GPT 都在真空中运行,无法根据过去的交互进行学习或适应。这种限制极大地降低了它们的有用性和自主性,因为它们无法建立连续的知识或遵循对话的长期趋势。此外,如果没有内存,customGPT 就无法根据个人用户的需求和偏好定制其响应,而这对于创建真正个性化且有效的 AI 体验至关重要。具有讽刺意味的是,尽管 OpenAI 在语音和视觉技术方面取得了进步,但将定制 GPT 转变为强大工具的关键功能仍然难以捉摸,这让用户和开发人员处于期待和不断渴望更多功能的状态。
ChatGPT 开发面临的最大挑战不仅是技术性的,而且是实用性的:多模式可用性,或者换句话说,与其他应用程序的连接性。在理想的情况下,ChatGPT 能够无缝访问您的日历,自动重新安排或添加约会,甚至代表您打电话报告迟到。但目前看来,这种整合程度似乎还有很长的路要走。尽管 ChatGPT 现在可以“看到”、“听到”甚至感知我们的情绪,但问题仍然是这些功能是否真的向前迈出了一步,或者只是令人印象深刻且基本上无用的噱头。虽然 OpenAI 的创新令人钦佩,但人们常常感觉开发人员只是在用人工智能的潜力来戏弄我们,而真正提高 ChatGPT 实用性的关键功能仍然被安全和道德锁所束缚,从而减缓了人机交互的真正进展。
未来,ChatGPT 似乎将成为我们设备上的永久固定装置,部分原因是它通过应用程序与各种系统集成,最近推出的桌面应用程序已经表明了这一点。该应用程序朝着实现我们对人工智能的长期期望迈出了有希望的一步:自动或半自动执行某些任务。例如,该应用程序可以自动判断哪些电子邮件很重要,或者提醒您路线上的交通堵塞。 ChatGPT 能够充当主动助手,预测用户的需求并做出反应,这为日常生活中的许多实际应用打开了大门,其中人工智能将能够充当数字世界的复杂性与我们日常生活之间的关键调解者需要。
也许 OpenAI 真的希望 ChatGPT 成为一个多功能且有趣的对话者,但这似乎不仅仅只是掩盖人工智能开发面临的真正限制。虽然最新的升级可能会令人印象深刻,但真正的考验将是 OpenAI 是否会打开 ChatGPT 全部潜力的大门,或者我们是否会继续见证一场技术“权力的游戏”,其中真正的力量隐藏在安全和隐私的面纱后面。道德问题。