大型語言模型(LLMs)在高品質訓練數據上具有高度依賴性。而在這方面,幾乎沒有任何組織能與 Stack Overflow 比擬,這是一個月度活躍用戶超過一億的知識共享平台。
今天,Stack Overflow 宣布與 Google Cloud 建立合作夥伴關係,以增強全球開發者的人工智慧(AI)能力。這一合作的關鍵在於將 Stack Overflow 廣泛的知識庫整合進 Google Cloud 的 AI 工具中,包括 Gemini 和 Cloud Console。這項整合將為開發者提供直接的相關回答、代碼片段和來自 Stack Overflow 社區的文檔。此合作彰顯了越來越多的 LLM 供應商(如 OpenAI)與內容提供者聯手以加強生成式 AI 訓練的趨勢。
新整合利用了 OverflowAPI,未來可能擴展到其他 LLM 供應商。
Stack Overflow 的 CEO Prashanth Chandrasekar 表示:“今天,Stack Overflow 正在推出一個新計畫,使 AI 公司能通過新的 API 獲取我們的知識庫。Google 是我們的首個合作夥伴,利用 Stack Overflow 的數據來增強 Google Cloud 的 Gemini,並在 Google Cloud 控制台中提供經過驗證的答案。”
OverflowAPI 對 Google 和 Stack Overflow 的益處
Google 獲得 Stack Overflow 的巨大信息庫是一個重要機會,儘管具體價值尚未透露。Chandrasekar 選擇不對合作的財務條款發表評論。
通過 OverflowAPI,Google 可以持續訪問 Stack Overflow 的公共數據,包括超過 5800 萬條問題和答案、數百萬用戶評論以及投票和編輯等元數據。
此合作對雙方都有利;Stack Overflow 將逐步採用 Google Cloud 技術作為主要託管平台。具體技術和服務仍在討論中。
重要的是,這一合作不限制 Stack Overflow 與其他 LLM 供應商的合作。Chandrasekar 澄清:“這不是與 Google 獨家的合作;他們無法訪問 Stack Overflow 的專有數據,包括客戶數據或個別用戶資訊。”
用新 OverflowAPI 互補 OverflowAI
這次與 Google 的合作是 Stack Overflow 探索生成式 AI 的又一步。2023 年 7 月,該公司推出了 OverflowAI 計劃。Chandrasekar 指出,新的 API 為 Stack Overflow for Teams 和其公共平台增強 AI 和機器學習(ML)能力,從而互補 OverflowAI。OverflowAI 計劃的例子包括 Stack Overflow for Visual Studio Code、增強搜索和 Slack 的自動回答應用。
另一方面,OverflowAPI 作為持續的數據訪問點,用於訓練和微調大型語言模型。Chandrasekar 說:“我們去年夏天對 OverflowAI 的目標是使開發者能夠為生成式 AI 的基礎貢獻力量,並成為其未來的重要部分。今天的公告標誌著全球最友好的開發者雲與領先的開發者知識平台之間的合作。”