在2024年Google I/O大會前,大家對Google即將發布的AI公告充滿期待。活動一開始,YouTube明星Marc Rebillet以浴袍裝扮,從一個巨大的杯子中出現,帶來了活力四射的表演。Rebillet以陽光的氛圍邀請觀眾分享奇妙的音樂創意,這些創意通過Google的AI DJ軟體得以實現。這充滿活力的開場預示著本次活動的主題將圍繞人工智慧,執行長Sundar Pichai提到“AI”一詞在整個活動中被提及121次。
隨著活動的結束,兩個問題浮現:Google的新產品是否只解決一些對日常生活影響不大的問題?以及在智能手機具備驚人AI功能的情況下,專門的AI硬體是否有可行的市場?
評估AI設備
目前市場上出現了多款吸引人的AI小工具,如Rabbit R1、Humane AI Pin及AI驅動的吊墜。這些設備的功能各異:有的可以聆聽,有的能對話、撥打電話、錄影以及與互動型AI機器人連結以解釋周圍環境。儘管這些設備創新十足,但使用體驗卻不盡如人意。行動部門編輯Joe Maring形容Rabbit R1為他遇過的最差小工具之一,而Humane AI Pin的表現也不遑多讓。儘管這些是第一代設備,但基於OpenAI和Google的最新見解,它們的未來仍然不明朗。
AI意識的演變
AI技術正在顯著進步,特別是在視覺技術方面,使AI能夠通過攝像頭解讀世界。在2024年Google I/O上,Google推出了Gemini Live,這是在OpenAI推出的GPT-4o全模態模型之後進行的,後者提升了AI處理文本、音頻及視覺的能力。這兩款產品旨在實現無縫的使用者互動:只需將攝像頭指向幾乎任何物品,AI便能提供上下文信息。它能識別衣物的適宜性、翻譯物品,甚至定位丟失的物品,如汽車鑰匙。
雖然ChatGPT與Gemini Live的體驗有所不同,但它們都擁有共同的基礎能力。這是一個關鍵時刻,顯示出智能手機上的AI與專用硬體之間的差距。
硬體挑戰
Rabbit R1和Humane AI Pin分別配備8MP和12MP的攝像頭,可以進行一些圖像處理。然而,它們無法與現代智能手機中先進、穩定的攝像頭競爭。普通智能手機提供高品質的視覺輸入,從而提升AI的理解能力,產出的清晰度顯著提高—這就像比較預算型和旗艦型智能手機之間的視頻質量一樣。
此外,這些AI設備搭載中階的MediaTek和Qualcomm芯片,無法與當代智能手機的計算能力相比,後者能更快地執行AI任務。用戶不想在基本語音助手可以迅速處理請求的情況下等待15秒的回應。
生成式AI主要有兩種運作方式:通過需要互聯網連接的雲端處理或通過Google的Gemini Nano在Pixel 8和某些三星設備上進行離線處理。後者使AI能在沒有互聯網的情況下運行,但目前尚無獨立的AI設備可以完全離線運行。
在設備上的AI優勢
憑藉在設備上的AI功能,用戶可以在Pixel手機上利用音頻轉錄等功能,而無需互聯網支持。Google的神經機器翻譯技術支持即時翻譯,而今年晚些時候,Gemini Nano將具備多模態處理功能,根據攝像頭和麥克風的輸入提供上下文反應。
這種方法不僅更快,而且增強了數據安全,因為個人信息保留在設備上,而不是在線上傳。此外,這可能降低提供生成性AI功能的成本,滿足消費者對於可負擔性的擔憂。
Gemini與Google服務的整合
整合的重要性在Google的服務套件中顯而易見,包括Gmail、Docs、Drive、Maps、Photos和Search。Gemini提供為這些服務量身定制的AI助手,用戶可利用Gemini計劃旅行,訪問相關郵件,並將該數據與Google Search整合,生成全面的旅行計劃。選擇Gemini Advanced的用戶可解鎖更多功能,比如處理大型PDF、代碼和多媒體,總結並提供關鍵見解。
Gemini在應用內直接增強任務,讓其在不打擾用戶的情況下,實時有效地提供支持。
智能手機取代專用AI設備的理由
AI助手應提供實用的支持,平衡功能和便利性。它必須利用相關數據強化個人和專業任務,而無需增加額外費用。然而,像Rabbit R1和Humane AI Pin這類當前的AI小工具由於其限制而難以實現這一承諾。鑑於智能手機的先進功能—以及它們能夠運行複雜的AI而無需專用硬體的缺陷—在劣質設備上投資似乎是不明智的,因為用戶可以依賴其手機獲得更佳性能。
在不斷演變的AI領域中,智能手機引領潮流,專門的AI設備變得越來越多餘。