人工智能科技的陨落：我们错过了什么？

Home Hardware CN 人工智能科技的陨落：我们错过了什么？

在2024年的Google I/O大会上，大家对谷歌可能发布的人工智能（AI）新产品充满期待。活动以YouTube明星Marc Rebillet的精彩表演拉开帷幕，他独特地从一个巨大的杯子里以浴袍造型现身，营造出活跃的氛围。Rebillet邀请现场观众分享奇思妙想，谷歌的AI DJ软件则将这些创意变为现实。这一热烈的开场预示着会议将聚焦人工智能，尤其是CEO桑达尔·皮查伊提到“人工智能”一词出现了121次。

随着活动的结束，随之而来的两个问题浮现：谷歌的新产品是否解决了真正影响日常生活的问题？此外，面对智能手机已经具备强大AI功能，专门定价在几百元的AI硬件是否还有市场？

AI设备的现状

市场上涌现出令人兴奋的AI设备，如Rabbit R1、Humane AI Pin以及AI驱动的挂件等。这些设备的功能各异，有的可以倾听，有的可以对话、拨打电话、录制视频，甚至与多话的AI机器人互动以解析周围环境。尽管这些设备很有创意，但用户体验普遍不佳。移动板块编辑Joe Maring将Rabbit R1称为他遇到过的最糟糕的设备之一，而Humane AI Pin的表现也不尽如人意。尽管这些都是第一代产品，但鉴于OpenAI和谷歌的最新见解，其未来仍显得不确定。

人工智能的演变

人工智能技术正快速进步，尤其是在视觉技术方面，使AI能够通过摄像头感知世界。在2024年Google I/O上，谷歌推出了Gemini Live，此前OpenAI发布了增强文本、音频和视觉处理能力的多模态模型GPT-4o。这两款产品都旨在实现无缝的用户互动：只需对准摄像头，AI便可提供上下文信息，识别衣物的适当性、翻译物体，甚至找到遗失的物品如车钥匙。

尽管ChatGPT和Gemini Live的体验有所不同，但它们共享基础能力。这是一个关键时刻，人工智能在智能手机与专用硬件之间的差距显而易见。

硬件挑战

Rabbit R1和Humane AI Pin分别配备了8MP和12MP的摄像头，具备一定的图像处理能力。然而，它们无法与现代智能手机中先进且稳定的摄像头相媲美。常规智能手机通过提供高质量的视觉输入，增强了AI的理解能力，输出效果更清晰；就像经济型智能手机与旗舰机型之间的画质差异一样。此外，这些AI设备搭载的中端MediaTek和高通芯片，缺乏当今智能手机所具备的计算能力，这使得AI任务无法快速处理。用户不愿意在响应时间上等候15秒，而即使是基础的语音助手也能更快地完成请求。

生成式AI主要通过两种方式运行：需要互联网连接的云处理，或像谷歌的Gemini Nano一样的离线处理。后者使得AI能够在没有互联网的情况下工作，但目前尚无独立的AI设备能够完全独立于网络运作。

设备端AI的优势

凭借设备端AI的优势，用户可以在Pixel手机上使用音频转录等功能，而无需连接互联网。谷歌的神经机器翻译技术实现实时翻译，而今年晚些时候，Gemini Nano将通过多模态功能，实现基于摄像头和麦克风输入的本地处理。这种方式不仅更快，还提高了数据安全性，因为个人信息保留在设备中，而非在线传输。此外，它还有助于减少提供生成式AI功能的成本，缓解消费者在AI繁荣时代对价格的担忧。

Gemini与谷歌服务的整合

Gemini与谷歌的多项服务无缝整合，如Gmail、Docs、Drive、Maps、Photos和搜索等。Gemini提供定制的AI助手，旨在支持这些服务中的特定任务。用户可以利用Gemini规划旅行，获取相关电子邮件，并将数据与谷歌搜索结合，生成全面的旅行行程。对于选择Gemini Advanced的用户，更多功能将等待他们，例如处理大规模PDF、代码和多媒体内容，提供精华提炼。

Gemini能够在应用内直接增强任务执行，保持低调却依然有效地支持用户实时需求。

智能手机的优势

AI助手应提供实用的支持，兼顾功能与便利，利用相关数据提升个人与职业任务，而无需额外费用。像Rabbit R1和Humane AI Pin这样的当前AI设备因其局限性难以兑现这一承诺。考虑到智能手机的先进功能——以及其在没有专用硬件缺点的前提下运行复杂AI的能力——投资于这些低效设备显得不明智，因为用户可以依赖智能手机获取更优性能。

在快速发展的AI领域，智能手机正在引领潮流，致使独立的AI设备愈加显得多余。

微软发布新一代PC，搭载Copilot+智能助手整合

我与改变游戏规则的AI设备同住四天——揭秘它为何一团糟