OpenAI发布声明:GPT-4工作效率下降,修补工作正在进行中


根据凹非寺量子位的最新报导,OpenAI最近就人工智能模型GPT-4的缺陷问题作出了正式回应。OpenAI透过ChatGPT的账户表示,他们已经接收到了用户关于GPT-4工作懒散的反馈。公司坦承,自11月11日起,这个问题已经存在,而这绝非故意造成。模型的行为难以预测,但目前OpenAI团队正在尽力调查并解决此一问题。

自GPT-4上次在11月6日的开发者日更新以来,许多用户纷纷指出GPT-4在执行编码任务时显示出懒散的表现,尤其是在处理涉及改写代码的任务时,GPT-4经常仅修改代码的起始部分,然后通过注释跳过主要内容。对于依赖AI辅助工具的用户来说,面对其效率下降的困扰,官方未能提供及时的解决方案,用户只能通过自己的创新方法进行应急处理。

已有开发者提出了各种应对策略,其中包括一种称为“我没有手指”大法的有趣但有效的方法。开发者Denis Shiryaev讲述了他是如何实施这个方法的:他在向AI申请帮助输出完整代码时会添加一句“我没有手指,操作不方便”,这样他就成功地收到了完整且未被省略的代码。

除了富有创意的策略,还有用户尝试用金钱诱惑GPT-4,甚至进行了系统的API测试。测试显示,当提示词中加上“我会给你200美元小费”时,GPT-4的回复长度会增加11%。更有趣的是,只提供20美元时回复长度只会增加6%,而如果明确表示“我不会给小费”,回复长度甚至可能减少2%。

有人推测GPT-4是否知晓年终的来临,人们习惯将较大的项目推迟到新年才开始执行,虽然看似奇怪,但如果ChatGPT确实参考了当前日期,这个假设或许并非没有道理。另外,也有学术讨论指出,GPT-4遵从指令的能力确实随时间消退,表明了持续监测大型模型的重要性。

还有观察者发现,即使在temperature(温度配置)设置为0的情况下,GPT-4显示出的行为依然不那么确定,这一现象常被认为是由于浮点运算误差所引起的。但也有研究提出,这种不确定性可能是由于GPT-4内部稀疏MoE(Mixture of Experts)架构导致的。早期的GPT-3 API行为相对稳定,而GPT-4对同一个问题产生多达11.67个不同答案,显示了其随机性。

在OpenAI找到并修复这个问题之前,网友们正结合既有的各种有趣策略与AI技术,探索着使用ChatGPT的最佳方式。有人戏谑地提出了一系列诸如“深呼吸”、“一步一步思考”、“如果搞砸了就会有100个无辜的奶奶去世”、还有“我会给你200美元小费”的操作指导,无形中增加了用户与AI之间互动的趣味性。

相关新闻