谷歌的Gemini人工智能和OpenAI的ChatGPT(基于GPT-4模型)是当今市场上领先的AI解决方案。这两者均能理解并互动文本、图像、视频、音频和代码,能够产生多样化的输出。同时,它们也提供专业知识,这些知识若依赖专家人力协助会非常昂贵。
如果您正在考虑投资时间和精力掌握哪种AI工具,明智选择是至关重要的。那么,哪种AI解决方案更优?是Gemini还是GPT-4?
可用性与定价
Gemini提供Pro和Nano版本,而Ultra型号将于未来发布。目前,GPT-4和Google Gemini都已开放使用。Gemini Pro自2023年12月6日起通过Bard提供免费使用,仅需一个Google账户。相比之下,GPT-4通过ChatGPT工具提供,需要每月$20的GPT-Plus订阅。
您也可以通过微软的Bing Chat访问GPT-3.5(偶尔也能使用GPT-4)。一些工具提供有限的GPT-4免费访问,但主要平台仍是ChatGPT。需要注意的是,虽然Gemini Pro有效,但并不是最终版本;谷歌承诺,Gemini Ultra将是其AI选项中最先进的。此外,Gemini Nano可在某些智能手机上本地运行,主要用于文本摘要和校对,功能有限。
功能
Gemini和GPT-4的主要功能相似。两者均能解读和处理文本、图像、视频、音频和代码,适用于各种任务。用户可以进行一般对话、提问、根据冰箱中的食材找食谱、分析视频中的人群场景,或针对代码提出优化建议。
两种AI均支持额外扩展插件,但目前谷歌的选择较为有限。Gemini与Google Flights、Hotels、Maps、YouTube和Workspace应用集成,用户可以直接与文档互动并访问实时数据。同时,OpenAI的GPT-4提供更广泛的插件和扩展,由众多第三方开发者创造。这些插件增强了购物、高级计算、与众多应用的集成能力,甚至可预订餐厅表格。
在定制化方面,GPT-4表现尤为出色。它允许用户创建针对特定任务的定制版本,减少日后对话中重复指令的需要。尽管Gemini允许新聊天会话的开启,当前尚不支持定制选项。此外,GPT-4包含DALL-E 3,可以按需生成图像;而Gemini虽然未来计划具备类似功能,目前尚无法实现此任务。若您订阅GPT-Plus,无需单独购买图像生成服务。
响应速度
在响应时间上,Gemini显示出明显优势。虽然GPT-4在高峰使用期可能会出现延迟或中断,有时反应迟缓,Gemini则能快速回应。两者均允许用户进行信息核实:GPT-4会引用其主张的来源,Gemini则提供按钮,便于用户自行进行Google搜索核实信息。
结论:哪种AI更好,Gemini还是GPT-4?
谷歌推出Gemini时宣称,其Pro模型在多个AI应用和基准测试中超越了GPT-4,包括推理能力。然而,在现实场景中评估这两种AI的能力,会发现它们在处理相同提示时都能提供令人印象深刻的回复,无论是文本、视觉、视频还是编码任务。
在我对游戏编码问题的体验中,两者都能很好地作为对话聊天机器人使用。Gemini似乎在讨论或识别某些个人图像时较为谨慎;它未能识别一位名人的服装,也无法提供个人见解。相对而言,GPT-4则没有表现出这样的犹豫。
尽管Gemini允许通过Google进行事实核查,但它没有利用搜索引擎来收集关于我的信息,而GPT-4则有效地使用Bing完成此任务。总体来看,目前GPT-4似乎占有优势。其强大的工具集、丰富的插件选项和可定制的聊天机器人提供了更全面的体验。尽管Gemini展现出相当的基本能力和快速响应时间,但目前在功能的深度上尚显不足。随着Gemini Ultra的未来发布,我们需要观察其在谷歌AI产品中的整合,才能做出进一步的比较。