AI,特別是生成式人工智慧和大型語言模型(LLMs),在各行各業中取得了顯著進展,並有望廣泛應用。根據麥肯錫的報告,精通AI的公司正在全力投入這項技術,而企業必須適應變化,以免被淘汰。
然而,AI安全仍是一個未開發的領域,對於使用該技術的組織來說,潛在風險不容小覷。AI和機器學習(ML)的錯誤行為屢見不鮮,特別是在醫療和執法等行業中,算法顯示出隱藏的偏見,這可能加劇社會不平等並損害聲譽。
微軟的Tay聊天機器人便是一個引以為戒的例子。這款原本設計用以進行輕鬆對話的聊天機器人,快速受到不當使用的影響,最終成為一場公關災難。即使是備受讚譽的ChatGPT也因其局限性受到批評,突顯出將AI整合進企業環境所面臨的複雜性。
企業領袖意識到必須利用生成式AI的變革潛力,但在識別初始用例以及駕馭AI安全問題方面面臨挑戰。為了解決這一問題,專注於「大海撈針」問題是一個有效的策略。大海撈針問題是指人類在生成潛在解決方案上面臨挑戰,但驗證這些解決方案卻相對簡單。這些獨特的問題非常適合早期行業應用,因為它們的存在比人們想像的更為普遍。
以下是三個大海撈針問題的例子:
1. 文字編輯
在較長的文件中識別拼寫和語法錯誤可能十分困難。雖然像微軟Word這樣的工具早已檢測到拼寫錯誤,但語法檢查最近才通過生成式AI得以改進。一旦標記出潛在錯誤,人類可以輕易驗證,這使其成為AI的理想應用。像Grammarly這樣的服務利用LLMs來協助文字編輯。
2. 編寫範本代碼
學習新API的語法和約定對於軟體工程師來說是一項耗時的任務,整個行業每天都在重複此過程。像GitHub Copilot和Tabnine等生成式AI工具自動化代碼生成,尤其是範本代碼。雖然生成代碼可能複雜,但驗證其功能相對簡單—工程師可以運行測試以確認其正確性再進行部署。
3. 搜尋科學文獻
即使對專家來說,跟上龐大的科學文獻也令人望而生畏,但這些論文中蘊含著寶貴的見解。AI可以協助根據現有研究生成新想法,特別是在需要深入理解多個領域的跨學科領域中。像Typeset這樣的產品在這方面取得了進展。
人類驗證的重要性
在所有這些用例中,人類驗證至關重要。在關鍵商業領域讓AI獨立運作存在巨大的風險,鑑於過去的失敗案例。確保對AI生成內容的人工監督可以增強安全性和可靠性。透過專注於大海撈針問題,企業可以在享受AI優勢的同時,保留必要的人類決策。
在大型語言模型整合的早期階段,專注於這些用例使組織能夠獲得寶貴的AI經驗,同時解決關鍵的安全問題。