OpenAI 公布模型規範：揭示所期望的 AI 行為洞見

Home AI新聞 OpenAI 公布模型規範：揭示所期望的 AI 行為洞見

OpenAI承諾履行其在人工智慧（AI）領域的「開放性」承諾。儘管該公司尚未將其新模型開源，但正在積極應對AI對社會的影響，包括虛假資訊和深度偽造等挑戰。本週，OpenAI推出了「模型規範」（Model Spec），這是一份旨在指導可通過應用程式介面（API）和ChatGPT存取的AI模型行為的框架文件。OpenAI通過一個網絡表單徵求公眾對該文件的反饋，該表單的截止日期為5月22日。

OpenAI的聯合創始人兼首席執行官山姆·奧特曼（Sam Altman）在X平台上指出：「我們將傾聽、討論並隨時間調整，但我認為，澄清什麼是錯誤、什麼是決策將非常有用。」

為什麼要發布模型規範？

模型規範的推出符合OpenAI的使命，確保AI技術安全且有益於用戶。然而，實現此目標是複雜的，並常與關於技術與社會的長期哲學辯論交織在一起。OpenAI在其博客中強調：「即使一個模型旨在廣泛受益，實際應用可能會發生衝突。例如，某個安全公司可能使用合成數據來開發防釣魚工具，但該能力也可能被詐騙者利用。」

通過分享這一初步草稿，OpenAI邀請公眾參與有關AI開發的倫理和實踐層面的討論。用戶有兩週時間通過OpenAI的反饋表單提交他們的見解。在此期間結束後，OpenAI計劃發布有關模型規範修改的更新、用戶反饋的回應以及在未來一年內塑造模型行為的進展。

儘管OpenAI尚未詳細說明模型規範將如何影響AI行為，或其原則是否會整合到用於模型對齊的「系統提示」中，但預期其會產生重大影響。在某種程度上，模型規範類似於競爭對手Anthropic AI的「憲法」方法——這一概念最初使Anthropic與眾不同，但最近並未受到過多強調。

AI行為的框架

模型規範包括三大核心組件：目標、規則和默認行為，這些組件指導AI互動，以確保有效性和倫理標準。

- 目標：該文件概述了旨在幫助開發者和用戶的廣泛原則，這些原則包括高效促進用戶目標、考慮不同利益相關者的影響以及增強社區福利。

- 規則：建立明確的規則以指導AI互動，確保遵循相關法律、尊重知識產權、保護隱私，並禁止不安全內容。

- 默認行為：指導方針強調假設良好意圖的重要性，必要時尋求澄清，並最大化幫助而不超越界限。這一方法旨在平衡用戶的多樣需求。

一些人，包括AI影響者和沃頓商學院教授伊桑·莫利克（Ethan Mollick），將這些原則與艾薩克·阿西莫夫於1942年提出的「機器人三大法則」相提並論。然而，模型規範的實施仍面臨批評，特別是在其如何影響AI回應方面。科技作家安德魯·庫蘭（Andrew Curran）指出了一個例子，其中「AI助手」未能挑戰用戶錯誤主張地球是平的觀點。

持續的參與與發展

OpenAI承認模型規範是一份活文檔，反映了目前的實踐並承諾根據不斷的研究和公共反饋進行調整。該組織旨在收集多樣的觀點，尤其是全球利益相關者的意見，如政策制定者和領域專家。反饋將顯著影響模型規範的改進和未來的AI發展。OpenAI打算通報公眾有關此反饋循環中獲得的變化和見解，以重申其對負責任AI開發的承諾。

接下來該怎麼做？

通過清晰表達所期望的AI行為，並徵求國際社區的意見，OpenAI努力為AI創造積極的社會影響，即使在法律審查和有關藝術家在訓練數據中同意的批評聲中。

Yellow 獲得 A16z 500 萬美元投資，用於開發增強型人工智慧 3D 建模工具

解開生命藍圖：Google 的 AlphaFold 3 AI 如何預測存在的基本構建塊