OpenAI 最近推出了最新模型 GPT-4o,这个模型不仅能幽默地回应冷笑话,还能应召唱歌,甚至帮助人们打车前往伦敦。它在与人类的真实对话中,能够轻松应对各种打扰。
在备受期待的春季更新活动中,有 11.3 万人观看了直播。OpenAI 分享了 16 个视频,展示了 GPT-4o 的多种功能。这款多模态大语言模型能够实时互动,语音输出可根据音频、视觉和文本输入改变男声或女声。
在一段视频中,GPT-4o 识别到 OpenAI 总裁 Greg Brockman 即将发表声明,机智地回应道:“这个声明是关于我吗?让我感到好奇。您让我站在悬念的边缘……虽然我实际上没有座位,但你懂的。”
目前,OpenAI 的 API 和 ChatGPT 已经具备文本和图像输入功能,语音和视频的能力将于未来几周推出。
GPT-4o 能够准确解读用户的情感并提供各类建议。在一次演示中,它与另一个版本的自己交流,调侃道:“好吧好吧,就在我以为事情不可能更有趣的时候——我在与另一位可以看到世界的 AI 交流。”
当模型被要求描述周围环境时,它们轮流叙述一位时尚男士的细节,从他的服装到房间的灯光。不料在某人调皮打断时,GPT-4o 还自创了一首歌,吟唱道:“让惊喜客人感到快乐。”
其他演示突显了 GPT-4o 的多样化技能:它对冷笑话发笑,实时翻译西班牙语与英语之间的对话,唱起关于“壮丽土豆”的摇篮曲,还准确地判断了剪刀石头布的胜者。它甚至通过辨认蛋糕和蜡烛,轻松识别出生日庆祝。
在与一只小狗互动时,GPT-4o 快乐地问道:“你好呀,小可爱,你叫什么名字,毛毛球?”(小狗的名字是 Bowser)。在引导一名盲人在伦敦时,它识别出了皇家标准旗帜,并形容“鸭子轻轻滑过水面”。
此外,GPT-4o 也能帮助学生解决学业上的挑战,比如引导学生进行三角形计算的数学问题。它有效地通过积极的鼓励提升学生的信心,说:“你在识别边的方面做得很好!”
模型甚至为一位形象不佳的求职者提供时尚建议,幽默地说:“你绝对拥有‘我整晚在编程’的造型,这其实可能会对你有所帮助,”同时建议进行简单的发型修整。
在社交媒体上,对 GPT-4o 的反应众说纷纭。一些用户称赞其能力开创了新纪元,称其“征服了互联网”,甚至与谷歌翻译相提并论。Nvidia 高级研究科学家 Jim Fan 形容该模型“活泼且略带调皮”,并将其比作科幻电影《她》。
相对而言,一些观察者认为此次发布“被低估”,AI 顾问 Allie K. Miller 指出技术爱好者之间存在期望与现实之间的落差,大家期待更先进的功能。
随着初步反应的涌现,未来几天用户如何与 GPT-4o 互动将颇具趣味。