苹果的人工智能进展:苹果GPT的崛起
最近,有传言称苹果正在开发一款名为苹果GPT的聊天机器人,旨在模仿OpenAI的ChatGPT,使用苹果自有的AI模型。在生成式人工智能产品迅速涌现的时代,从谷歌的Pixel智能手机到三星的Galaxy S24系列,苹果的态度却显得较为谨慎。苹果首席执行官蒂姆·库克(Tim Cook)向投资者透露,生成式人工智能将于今年晚些时候推出,标志着公司的“新篇章”。此外,苹果似乎正在寻求谷歌或OpenAI的支持,以实现其目标。
据彭博社报道,苹果正与谷歌洽谈在iPhone上使用Gemini AI模型的授权,这一策略与三星在Galaxy S24系列中采用谷歌的Gemini Nano模型颇为相似。虽然协议的具体细节尚未确定,苹果同样在与OpenAI进行沟通。考虑到OpenAI的技术已集成入微软产品及独立应用(如ChatGPT Plus),对于苹果的AI发展,外界既充满期待又有些忧虑。
苹果的AI进展
到2023年底,苹果悄然推出了一系列基于自家芯片的AI模型和框架,为Mac系列引入生成式人工智能功能,这与高通在Snapdragon X Elite平台上的努力相似。此外,苹果的研究团队发布了一篇关于名为Keyframer的生成式AI工具的论文,该工具利用GPT-4模型进行静态图像处理,通过矢量图形实现。
另一项创新工具允许用户通过简单的语音命令进行图像编辑,类似于高通在其最新Snapdragon旗舰芯片中推广的语音辅助媒体编辑工具。彭博社后续的报道指出,苹果正在加强专门团队以评估生成式AI能力,计划在2024年前向开发者提供这些工具。
传言称,苹果首批生成式AI功能可能将于6月随iOS 18的发布而亮相,重点关注本地设备的功能,而非基于云的解决方案。
Gemini的本地功能
Gemini可以在保持网络连接的同时,存在于手机本地,提供多种功能。例如,它可以在录音机应用中总结对话,甚至在离线状态下也能运行。此外,Gemini Nano为Gboard键盘应用带来了智能回复功能,提供上下文感知的建议及离线翻译能力。
一旦安装Gemini应用,用户可以通过自然语言进行互动,获得写作、头脑风暴、快速总结电子邮件和文档、生成图像、获取场景信息、解读屏幕内容以及使用谷歌地图和谷歌航班进行旅行规划的帮助。
苹果与谷歌的合作前景
如前所述,三星与谷歌的紧密合作使得Gemini Nano AI模型能够在其旗舰设备上应用,而苹果也可能轻松复制这一模式。即使设备授权谈判未能成功,Gemini仍然可以通过应用程序获得访问。然而,虽然Gemini的许可可以显著改变用户与iPhone的互动,但其对Siri的提升潜力仍然不明朗。
目前,谷歌尚未完全将Gemini与Google Assistant整合。尽管Gemini可能会取代安卓设备上的助手,Google Assistant在许多日常任务中仍然至关重要。鉴于苹果的软件生态系统的紧密集成,Gemini与Siri之间的角色分配可能会导致用户困惑。
苹果也可以与谷歌合作,开发独特的整合解决方案,将Gemini与苹果生态系统的功能结合起来。然而,考虑到Gemini当前的数据存储政策,深度集成的可能性似乎不大。
苹果面临的挑战
显然,苹果在生成式人工智能领域滞后,急于追赶。Gemini授权交易表明,我们可能永远无法看到苹果在Ajax项目下的AI开发成果,只能接受妥协的替代方案。尽管Gemini功能强大,但并非没有缺陷;用户指出在图像生成中存在重大差异,尤其是在肤色和种族方面。
随着争议的加剧,谷歌已暂停Gemini的文本转图像生成功能。在一份内部备忘录中,谷歌首席执行官承认,此类错误是“完全不可接受的”。在印度,Gemini引发了对政治敏感言论的讨论,突显了对AI监管的紧迫性。
对于以谨慎著称的苹果而言,在全球范围内推广Gemini是一项高风险的举措。随着谷歌提醒用户关于Gemini可能出现的错误,苹果必须仔细评估这一冒险。