在2024年的Google I/O大会上,大家对谷歌可能发布的人工智能(AI)新产品充满期待。活动以YouTube明星Marc Rebillet的精彩表演拉开帷幕,他独特地从一个巨大的杯子里以浴袍造型现身,营造出活跃的氛围。Rebillet邀请现场观众分享奇思妙想,谷歌的AI DJ软件则将这些创意变为现实。这一热烈的开场预示着会议将聚焦人工智能,尤其是CEO桑达尔·皮查伊提到“人工智能”一词出现了121次。
随着活动的结束,随之而来的两个问题浮现:谷歌的新产品是否解决了真正影响日常生活的问题?此外,面对智能手机已经具备强大AI功能,专门定价在几百元的AI硬件是否还有市场?
AI设备的现状
市场上涌现出令人兴奋的AI设备,如Rabbit R1、Humane AI Pin以及AI驱动的挂件等。这些设备的功能各异,有的可以倾听,有的可以对话、拨打电话、录制视频,甚至与多话的AI机器人互动以解析周围环境。尽管这些设备很有创意,但用户体验普遍不佳。移动板块编辑Joe Maring将Rabbit R1称为他遇到过的最糟糕的设备之一,而Humane AI Pin的表现也不尽如人意。尽管这些都是第一代产品,但鉴于OpenAI和谷歌的最新见解,其未来仍显得不确定。
人工智能的演变
人工智能技术正快速进步,尤其是在视觉技术方面,使AI能够通过摄像头感知世界。在2024年Google I/O上,谷歌推出了Gemini Live,此前OpenAI发布了增强文本、音频和视觉处理能力的多模态模型GPT-4o。这两款产品都旨在实现无缝的用户互动:只需对准摄像头,AI便可提供上下文信息,识别衣物的适当性、翻译物体,甚至找到遗失的物品如车钥匙。
尽管ChatGPT和Gemini Live的体验有所不同,但它们共享基础能力。这是一个关键时刻,人工智能在智能手机与专用硬件之间的差距显而易见。
硬件挑战
Rabbit R1和Humane AI Pin分别配备了8MP和12MP的摄像头,具备一定的图像处理能力。然而,它们无法与现代智能手机中先进且稳定的摄像头相媲美。常规智能手机通过提供高质量的视觉输入,增强了AI的理解能力,输出效果更清晰;就像经济型智能手机与旗舰机型之间的画质差异一样。此外,这些AI设备搭载的中端MediaTek和高通芯片,缺乏当今智能手机所具备的计算能力,这使得AI任务无法快速处理。用户不愿意在响应时间上等候15秒,而即使是基础的语音助手也能更快地完成请求。
生成式AI主要通过两种方式运行:需要互联网连接的云处理,或像谷歌的Gemini Nano一样的离线处理。后者使得AI能够在没有互联网的情况下工作,但目前尚无独立的AI设备能够完全独立于网络运作。
设备端AI的优势
凭借设备端AI的优势,用户可以在Pixel手机上使用音频转录等功能,而无需连接互联网。谷歌的神经机器翻译技术实现实时翻译,而今年晚些时候,Gemini Nano将通过多模态功能,实现基于摄像头和麦克风输入的本地处理。这种方式不仅更快,还提高了数据安全性,因为个人信息保留在设备中,而非在线传输。此外,它还有助于减少提供生成式AI功能的成本,缓解消费者在AI繁荣时代对价格的担忧。
Gemini与谷歌服务的整合
Gemini与谷歌的多项服务无缝整合,如Gmail、Docs、Drive、Maps、Photos和搜索等。Gemini提供定制的AI助手,旨在支持这些服务中的特定任务。用户可以利用Gemini规划旅行,获取相关电子邮件,并将数据与谷歌搜索结合,生成全面的旅行行程。对于选择Gemini Advanced的用户,更多功能将等待他们,例如处理大规模PDF、代码和多媒体内容,提供精华提炼。
Gemini能够在应用内直接增强任务执行,保持低调却依然有效地支持用户实时需求。
智能手机的优势
AI助手应提供实用的支持,兼顾功能与便利,利用相关数据提升个人与职业任务,而无需额外费用。像Rabbit R1和Humane AI Pin这样的当前AI设备因其局限性难以兑现这一承诺。考虑到智能手机的先进功能——以及其在没有专用硬件缺点的前提下运行复杂AI的能力——投资于这些低效设备显得不明智,因为用户可以依赖智能手机获取更优性能。
在快速发展的AI领域,智能手机正在引领潮流,致使独立的AI设备愈加显得多余。