解鎖企業創新:16 個開源大型語言模型實際應用案例

媒體與科技專家指出,開源大型語言模型(LLM)可能會對企業內的生成式人工智慧產生重大影響,這種影響甚至可能超越OpenAI的ChatGPT或Anthropic的專有模型。儘管對開源模型進行了大量實驗和許多概念驗證項目,但成熟企業在披露其實際應用方面的步伐仍然緩慢。為了解決這一問題,我們聯繫了主要的開源LLM供應商,包括Meta、Mistral AI、IBM、Hugging Face、Dell、Databricks、AWS和Microsoft。我們的探詢揭示了16個值得注意的部署案例(詳見下文)。雖然這個數字並不龐大,但業界分析師預計到今年年底,開源應用的數量將會激增。

開源LLM採用緩慢的原因

開源模型的採用速度緩慢,其中一個原因是這些模型的出現時間較短。Meta於2023年2月推出了首個重大開源模型Llama,這距離OpenAI在2022年11月發布ChatGPT只有三個月的時間。而Mistral AI的Mixtral模型則在一個月前剛剛上市。因此,真實世界的部署才剛剛開始出現。開源倡導者承認,目前封閉模型的普及程度高於開源模型,但預測這一差距將逐漸縮小。

開源模型面臨的挑戰

目前的開源模型存在一定的限制。Replit創辦人兼CEO Amjad Masad指出,由於貢獻增強的難度,模型開發的反饋機制並不高效。然而,許多人可能低估了開源開發者之間正在進行的大量實驗,他們創造了數千個衍生模型,其中一些在特定任務上表現出與封閉模型相當甚至更優的性能,如FinGPT和BioBert。

大型公共模型對企業的有限價值

Dell AI戰略高級副總裁Matt Baker表示:“大型公共模型對私營企業幾乎沒有價值。”Baker解釋,這些模型往往過於通用,無法輕鬆整合私營企業的數據,而這些數據構成了組織進行的約95%的人工智慧工作。因此,許多企業正在探索開源解決方案,特別是在客戶支持與代碼生成領域,利用與通用封閉模型LLM不兼容的自定義代碼。

因企業考量而緩慢進展

Hugging Face的Andrew Jardine指出,企業通常在採納LLM應用時猶豫不決,因為他們更重視數據隱私、客戶體驗和倫理影響。企業通常會先進行內部使用案例的試點,然後再擴展到外部應用。雖然封閉模型在2023年底取得了顯著的部署,但預計開源實施將在今年加速。

儘管開源具有優勢,一些企業仍覺得開源管理較為繁瑣。與OpenAI等供應商的現有API合作通常被視為比管理開源授權和治理問題更簡單。

弥合開放與封閉模型的差距

Jardine強調,開放與封閉模型之間的區別越來越模糊。例如,許多公司,包括一家大型製藥公司,對內部任務使用封閉LLM,而對於識別敏感信息等特定功能則選擇開源模型。這一選擇反映了對數據控制的更高需求。

開源採用的理由

隨著模型調整和成本因素迅速變化,企業將可能尋求靈活性,以便在開源和封閉模型之間切換,以降低風險。許多公司更願意選擇開源模型來維持對敏感數據的控制,同時對其進行針對特定應用的調整。

一些公司,如Intuit和Perplexity,已經在開發生成AI編排層,使各種模型無論是開放還是封閉都能無縫整合,用於特定任務。雖然大規模部署開源模型可能需要更多努力,但隨著時間的推移,它們可以為擁有現有基礎設施的組織提供成本節省。

許多企業正悄然利用開源模型。例如,汽車公司和航空公司都在利用Databricks的湖倉平台進行應用實驗,該平台融合了開源LLMs。

識別開源部署的挑戰

定義真正的企業用例可能存在挑戰。雖然許多開發者和初創公司使用開源LLMs創建應用,但我們的目標是突出那些具有重要應用的成熟企業。我們將企業定義為至少擁有100名員工,並專注於最终用戶而非LLM技術的供應商。

定義“開源”也面臨挑戰,例如Meta的Llama具有限制性的許可證。此外,儘管像Writer這樣的公司開發了自己的LLMs,但只有某些模型屬於開源,這使得分類變得更加複雜。

以下是已文檔化的開源LLM企業部署示例:

1. VMWare:在自托管環境中利用Hugging Face的StarCoder模型增強代碼生成,確保專有代碼的安全。

2. Brave:這款以隱私為中心的瀏覽器為其對話助手Leo採用了Mixtral 8x7B模型。

3. Gab Wireless:實施Hugging Face模型過濾兒童安全消息,屏蔽不當內容。

4. Wells Fargo:使用Meta的Llama 2模型於多個內部應用,增強員工資源。

5. IBM:在其AskHR應用中整合開源LLMs,協助員工處理人力資源相關查詢,並在新咨詢服務中使用。

6. 格萊美獎:與IBM合作的“AI Stories”利用Llama 2為粉絲生成自定義洞見和內容。

7-9. 大部賽、溫布爾登、美國公開賽:利用IBM技術在賽事期間提供即時評論及重點生成。

10. Perplexity:專注於重新設計搜索的一家初創公司,利用開源LLMs對其搜索引擎的回應進行摘要。

11. CyberAgent:從Dell採用開源LLMs以滿足日語用戶需求的語言模型。

12. Intuit:將自己的LLMs與開源模型結合,以增強Intuit Assist功能的能力。

13. Walmart:開發對話式人工智慧應用,最初使用Google的開源BERT模型。

14. Shopify:在Sidekick中部署Llama 2,這是一個為電子商務業主簡化任務的AI工具。

15. LyRise:一家人才匹配初創公司,為招聘創建聊天機器人,並利用Llama進行互動。

16. Niantic:在手機遊戲Peridot中使用Llama 2推動角色互動。

儘管在定義和追蹤這些部署方面存在挑戰,但對開源LLMs的興趣正在增長。隨著更多公司探索它們的潛力,我們預計公共用例的數量會增加。我們將在新信息出現時持續更新此列表。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles