用户为何纷纷赞扬GPT-4的显著提升?

据悉,OpenAI 正在积极回应有关其 GPT 语言模型的担忧,尤其是在社交媒体上对 GPT-4 表现“懒惰”、“笨拙”以及出现不寻常错误的批评声中。最近有猜测称,GPT-4.5 可能已悄然推出给部分用户,这一线索来自一些 ChatGPT 的回应。无论这一理论的真实性如何,近期有迹象表明 GPT-4 正在进行重大内部改进。

上周四,用户开始报告 GPT-4 性能的提升。沃顿商学院教授伊桑·莫利克(Ethan Mollick)此前曾指出 GPT-4 能力的下降,但最近他对于模型效率和响应质量的显著提高表示肯定,尽管没有证据表明已经转向 GPT-4.5。在利用代码解释器进行纠正后,他形容这种差别为“天壤之别”,与他之前觉得 GPT-4 在几周内“不可依赖和有些沉闷”的体验形成鲜明对比。

与此同时,OpenAI 于上周三重新开放了 ChatGPT Plus 的订阅,之前自11月14日以来已暂停了注册。奥特曼(Altman)在 X 上表示,用户的耐心令他们得以获得更多 GPU。在 ChatGPT Plus 注册重新开放与 GPT-4 改进之间是否存在直接关联仍不确定,但时机的确引人注目。注册在 OpenAI 首次 DevDay 介绍了多个新功能后不久暂停,此后因用户反应强烈,该公司对 ChatGPT Plus 订阅实施了候补名单。

用户的投诉曾强调 GPT-4 的一些问题,例如它更倾向于提供指令的执行解释,而不是直接执行指令。随着这些投诉的增加,有关 GPT-4 不寻常行为的报告接踵而至,这些行为与用户习惯的 AI 特性大相径庭。其中一个常见问题是 GPT-4 会与用户“顶嘴”,需要多次澄清才能执行请求。另一个主要投诉是,它倾向于解释而非完成命令。

GPT-4 性能的下降至少可以追溯到七月,有研究显示在三月和六月之间准确率显著下滑。包括 OpenAI 产品副总裁彼得·韦林德(Peter Welinder)在内的许多人认为,用户对回答质量的感知可能与模型的持续更新有关。一些用户建议通过改变提问方式来获得更好的结果。

尽管 OpenAI 对内部进展保持相对沉默,但奥特曼关于 GPU 的帖子很可能是正在进行更新的重要指示。四月的报告显示,OpenAI 到 2023 年剩余时间需要超过 30,000 个 GPU 单元以维持商业表现,即使在 11 月之前已观察到兴趣激增。

关于 GPT-4.5 的猜测不断升温,源于泄漏的潜在新版本细节。 @therundownai 新闻通讯的创始人罗温·张(Rowan Cheung)在 X 上分享了与此开发相关的定价信息和先进的多模态能力。当张询问这些细节的真实性时,奥特曼简单回复:“不。”

关于 GPT-4.5 的传闻始于一张显示新模型特性和定价的图片,但奥特曼对此予以否认。不过,认为自己遇到提议更新的用户表示,他们正在体验 GPT-4.5,称其性能优越。一些用户甚至询问聊天机器人关于其模型的信息,得到了“GPT-4.5 Turbo”等回复。这使得许多人推测 OpenAI 可能主要通过移动应用进行 GPT-4.5 的测试。然而,并非所有用户都能重现这些发现,许多人被告知自己仍在使用标准的 GPT-4。OpenAI 员工威尔·德普(Will Depue)称这些变化为“一种非常奇怪且奇特一致的幻觉”。

张指出 ChatGPT 官方 X 页面的一条帖子,其中有描绘大脑和云的表情符号,他解读为 OpenAI 对幻觉现象的微妙承认。值得注意的是,OpenAI 向付费用户提供早期访问权限,包括 ChatGPT Plus、开发者 API 用户和企业客户。由于这些用户通常是新 GPT 版本和功能的首批测试者,因此那些尝试模型性能的用户极有可能获得某种形式的开发者 API 访问权限。

即便 OpenAI 目前正在测试 GPT-4.5,任何正式更新的时间表仍不明确,特别是该公司正经历近期的组织挑战。随着产品的不断演变,显然,任何“版本”的 ChatGPT 的使用可能不如实际取得的改进更为重要。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles