「全新的行動AI時代。」這是三星對即將推出的Galaxy S24智能手機系列的宣傳口號。在即將舉行的Unpacked活動中,該公司承諾將推出「由AI驅動的全新行動體驗」。
三星並非首家利用當前AI熱潮的公司,像ChatGPT和Midjourney等平台引發的關注已經吸引了智能手機處理器的主要廠商,壳牌高通與聯發科近期便展示了其最新旗艦及中階芯片上令人印象深刻的在地生成AI功能。
顯然,AI將主導智能手機的市場行銷,但我們究竟能期待什麼?這些所謂的「AI進步」所帶來的附加價值仍不明朗,可能只是將現有功能重新包裝成新名稱或應用。
從Galaxy S24系列開始,這些設備將搭載高通的Snapdragon 8 Gen 3處理器。這家芯片製造商對其生成AI能力提出了驚人的主張,並表示使用Stable Diffusion技術可在一秒鐘內根據文本提示創建圖像。高通也詳細說明了其如何優化Stable Diffusion以進行在地使用。與此同時,聯發科則宣稱其Dimensity 9300也將支持近乎瞬間的文本到圖像生成功能。值得注意的是,目前已配備高通最新芯片的iQoo 12在市場推廣中並未提及這些生成AI功能。
假設三星會提供文本到圖像生成,這一功能最終會帶來什麼成果?目前尚不清楚這一能力是會被整合進第三方應用還是三星自家應用中。關鍵問題在於如何增強日常智能手機使用。典型的Galaxy S24使用者會如何利用AI生成的圖像?他們可能會用來豐富對話或在社交媒體上引起轟動。
然而,過程並不簡單。使用者需要從文本生成圖像,然後將其保存在本地或複製到剪貼簿,最後再粘貼到所選的聊天應用中。理想的解決方案應當是三星將這一圖像生成功能直接整合進鍵盤中。然而,不禁要問,為何要經歷這個過程,而表情符號、GIF和貼紙也能達到類似的效果?此外,512 x 512像素的輸出分辨率可能無法滿足大學作業或工作簡報等高要求的任務。此外,根據聯發科的演示,可能還會涉及費用,Galaxy S24的使用者可能會面臨文本到圖像生成的代幣限制,超出設限後將導致性能下降或需要訂閱費用。
如果確實如此,則會引發對實用性的擔憂,因為如OpenAI的DALL-E等其他解決方案隨時可用。使用者可以免費生成圖像,或者訂閱ChatGPT Plus以獲得更快的速度和更新的DALL-E 3模型的更高質量。高通聲稱Snapdragon 8 Gen 3是「首款支持多模態生成AI模型」的處理器,意思是內建的聊天機器人(基於Meta的Llama模型)將接受文本、圖像和語音輸入。然而,這並不算突破性的功能,因為類似的能力在ChatGPT-4中已經存在,儘管需要訂閱。
高通還宣稱的一個引人注目的功能是AI圖像擴展,允許用戶向任意方向擴展圖像的畫布。該設備的生成AI將根據用戶的提示智能地生成像素,向場景中添加新元素。雖然這可能展示了令人驚豔的能力,但改變包含珍貴回憶的個人照片,風險在於將這些回憶與不真實的視覺扭曲。
摘要生成是另一個在地生成AI的關鍵領域。這可以提升用戶在當前事件中的資訊獲取方式。然而,其有效性依賴於易用性;例如,使用者能夠在不切換到其他應用的情況下總結新聞文章,將大幅提升使用體驗。
其他提議的功能,如基於語音的照片編輯,聽起來便利,但當前的一鍵過濾功能已經提供快速且令人滿意的編輯體驗,難以評估這些功能的真實價值。再回到基本功能,例如生成通用聊天回應或獲得通常需要互聯網搜索的答案,問題再次出現。
在智慧型手機上本地運行的生成AI模型,比如Meta的Llama,並不是最先進的,主要是因為資源有限。以Google為例,Pixel 8 Pro使用的是其大型語言模型的一個基本版本,稱作Gemini Nano。為何不選擇更強大的模型,如ChatGPT或Pi,透過專門的移動應用呢?
目前,生成AI最實際的應用可能在於減少對雲服務的依賴,實現離線任務同時增強數據隱私。理想情况下,這些在地工具應無縫整合現有的虛擬助手,如Google Assistant、Alexa或Siri。想象一下,指示你的AI助手將畫廊中所有的貓咪圖片編輯成拼貼,或計劃一次迪士尼樂園之旅,附上最佳票價和整齊的Google Calendar行程。
如果在地生成AI能讓用戶數據保持本地,理論上可以促進數據隱私環境。現階段,三星的AI功能承諾仍未確定。拭目以待,三星是否能提供真正有意義的生成AI體驗,或僅僅提供一系列耀眼但不實用的功能。