OpenAI 最新推出的 GPT-4o 是其最先进的大型语言模型(LLM),为免费和付费用户提供了一系列创新功能。作为一款多模态人工智能,GPT-4o 提升了 ChatGPT 的体验,具备更快速的响应、增强的理解能力,并将在未来几周内推出一系列新功能。
在 Meta 的 Llama 3 和谷歌的 Gemini 竞争加剧的背景下,OpenAI 的最新模型旨在引领潮流。以下是它令人兴奋的特点。
对于利用 ChatGPT 免费版且对 ChatGPT Plus 用户的功能感到羡慕的用户,您会很高兴地发现,现在可以体验图像识别、文件上传、在 GPT 商店找到自定义 GPT、使用记忆功能保存对话历史,进而实现更流畅的互动,以及进行复杂的数据分析和计算。
GPT-4o 从基础开始研发,具有 GPT-4 模型的智能。GPT-4o 的主要优势在于其计算成本较低,所需的 tokens 更少,使其更广泛地适用于大众。然而,免费用户在每天发送消息数量上会受到限制,达到上限后将自动退回到 GPT-3.5 模型。
相比 GPT-3.5,GPT-4 引入了多项增强功能,其中速度尤为重要。尽管 GPT-4 有所改进,但整体表现较慢。而 GPT-4o 则能提供近乎即时的响应,使互动更为迅速,尤其在实时翻译和对话辅助等任务中尤为明显。
GPT-4o 在推出时支持文本和图像,并设计为未来能够使用语音命令和音频与用户互动。不同于 GPT-4 首先将语音转为文本,再进行处理,最后转换回语音,GPT-4o 能直接理解语音输入并作出相应反应。其快速处理能力使对话更自然,能够理解语气、节奏和情绪等微妙差异。GPT-4o 甚至能幽默、讽刺,能够根据需要即时调整回答,支持多语言以实现实时翻译,还可以唱歌甚至创作对唱。
与前代产品相比,GPT-4o 在用户理解方面有显著提升,尤其是口语交流。它更准确地解读语气和意图,让其能够保持轻松友好的态度。在分析代码或文本时,会考虑用户的意图,从而提供更贴心的回应,减少对具体提示的需求。此外,它对视频和图像的分析能力增强了其对周围世界的理解。
目前,Windows 用户仅能使用基本的协作功能,而 macOS 用户很快将可以从桌面直接全面使用 ChatGPT 和 GPT-4o 模型。一款新的本地桌面应用程序将提供增强的可访问性和改进的用户界面,简化互动。这款应用将很快向大部分 ChatGPT Plus 用户推出,并将在接下来几周内提供给免费用户,Windows 版本预计将在今年晚些时候发布。
目前公众可以访问 GPT-4o 的文本和图像功能,而先进的语音支持和实时视频理解功能也将在不久的将来推出,同时 macOS 桌面应用的广泛可用性也将随之而来。这些令人兴奋的更新和 ChatGPT 其他改进都指日可待。