OpenAI承諾履行其在人工智慧(AI)領域的「開放性」承諾。儘管該公司尚未將其新模型開源,但正在積極應對AI對社會的影響,包括虛假資訊和深度偽造等挑戰。本週,OpenAI推出了「模型規範」(Model Spec),這是一份旨在指導可通過應用程式介面(API)和ChatGPT存取的AI模型行為的框架文件。OpenAI通過一個網絡表單徵求公眾對該文件的反饋,該表單的截止日期為5月22日。
OpenAI的聯合創始人兼首席執行官山姆·奧特曼(Sam Altman)在X平台上指出:「我們將傾聽、討論並隨時間調整,但我認為,澄清什麼是錯誤、什麼是決策將非常有用。」
為什麼要發布模型規範?
模型規範的推出符合OpenAI的使命,確保AI技術安全且有益於用戶。然而,實現此目標是複雜的,並常與關於技術與社會的長期哲學辯論交織在一起。OpenAI在其博客中強調:「即使一個模型旨在廣泛受益,實際應用可能會發生衝突。例如,某個安全公司可能使用合成數據來開發防釣魚工具,但該能力也可能被詐騙者利用。」
通過分享這一初步草稿,OpenAI邀請公眾參與有關AI開發的倫理和實踐層面的討論。用戶有兩週時間通過OpenAI的反饋表單提交他們的見解。在此期間結束後,OpenAI計劃發布有關模型規範修改的更新、用戶反饋的回應以及在未來一年內塑造模型行為的進展。
儘管OpenAI尚未詳細說明模型規範將如何影響AI行為,或其原則是否會整合到用於模型對齊的「系統提示」中,但預期其會產生重大影響。在某種程度上,模型規範類似於競爭對手Anthropic AI的「憲法」方法——這一概念最初使Anthropic與眾不同,但最近並未受到過多強調。
AI行為的框架
模型規範包括三大核心組件:目標、規則和默認行為,這些組件指導AI互動,以確保有效性和倫理標準。
- 目標:該文件概述了旨在幫助開發者和用戶的廣泛原則,這些原則包括高效促進用戶目標、考慮不同利益相關者的影響以及增強社區福利。
- 規則:建立明確的規則以指導AI互動,確保遵循相關法律、尊重知識產權、保護隱私,並禁止不安全內容。
- 默認行為:指導方針強調假設良好意圖的重要性,必要時尋求澄清,並最大化幫助而不超越界限。這一方法旨在平衡用戶的多樣需求。
一些人,包括AI影響者和沃頓商學院教授伊桑·莫利克(Ethan Mollick),將這些原則與艾薩克·阿西莫夫於1942年提出的「機器人三大法則」相提並論。然而,模型規範的實施仍面臨批評,特別是在其如何影響AI回應方面。科技作家安德魯·庫蘭(Andrew Curran)指出了一個例子,其中「AI助手」未能挑戰用戶錯誤主張地球是平的觀點。
持續的參與與發展
OpenAI承認模型規範是一份活文檔,反映了目前的實踐並承諾根據不斷的研究和公共反饋進行調整。該組織旨在收集多樣的觀點,尤其是全球利益相關者的意見,如政策制定者和領域專家。反饋將顯著影響模型規範的改進和未來的AI發展。OpenAI打算通報公眾有關此反饋循環中獲得的變化和見解,以重申其對負責任AI開發的承諾。
接下來該怎麼做?
通過清晰表達所期望的AI行為,並徵求國際社區的意見,OpenAI努力為AI創造積極的社會影響,即使在法律審查和有關藝術家在訓練數據中同意的批評聲中。