GPT-4o 初步反应:是“实质性AGI”还是人工智能的下一个进化?

OpenAI最近推出了其最新的人工智能大型语言模型(LLM)——GPT-4o(Omni),初步反响已有所呈现。

目前,反馈情况各异。一些观众在观看OpenAI进行的26分钟简短演示后,希望看到更多内容。同时,该公司已发布了多个视频演示和更多信息。GPT-4o被认为在速度、开发者成本和识别、模仿人类情感方面表现突出,尤其是在音频能力上。

该模型对所有ChatGPT用户免费开放,包括非订阅用户。不过,付费订阅用户将在未来几周内率先体验这一功能。目前,它支持文本和视觉功能,音频和视频功能预计很快推出。

GPT-4o的设计理念是平等处理文本、音频和视觉数据,将所有形式的数据转化为标记。这一创新提高了处理速度并降低了成本。

以下是专家和意见领袖的看法:

Nvidia的高级研究经理Jim Fan指出:“OpenAI正在抢占Character AI的市场……这是朝向更情感化、富有个性的AI的一次转变,而这在过去OpenAI似乎有所抑制。”

沃顿商学院教授Ethan Mollick则表示:“GPT-4o并不是一次重大飞跃,而是这次。”

AI影响者Allie K. Miller表示对新推出的macOS ChatGPT应用充满热情,她说:“它就像一个全天候的同事,可以和你进行屏幕共享,永不疲惫。我想象人们能够长时间使用这个工具。”

AI开发者Benjamin De Kraker认为GPT-4o代表着朝向人工通用智能(AGI)的一大进步,他表示:“当一个虚拟的‘人’几乎无差别地能够听、说、看和推理时,这算什么呢?”

另一位开发者Siqi Chen强调了GPT-4o从文本生成3D对象的能力,他声称:“这将被证明是OpenAI历史上最被低估的事件。”

然而,记者James Vincent批评了该营销策略,称其“狡猾”,同时提醒道语音互动未必意味着能力的飞跃。

Gartner副总裁Chirag Dekate则觉得此次发布“略显平淡”,将其与几个月前的Google Gemini演示进行了比较。他指出OpenAI与Google、Microsoft等成熟科技巨头之间在能力上存在着日益扩大的“能力差距”,这些公司拥有丰富的数据和基础设施来支持其模型。

一些回响更为尖锐,反科技影响者“Artisanal Holdout”批评GPT-4o的发布时机相较于GPT-5的预期显得平淡。

相反,Late Checkout的首席执行官Greg Isenberg则表示:“变化的速度令人难以置信”,而AI教育者Min Choi赞扬此次发布,称其将“完全改变AI助手的格局”。

尽管GPT-4o仍处于初期阶段,许多功能尚待推出,但其已经引发了热烈反响,这表明OpenAI成功引起了广泛兴趣。

请继续关注我们在未来几天对这一新模型的评估。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles