有效利他主義對人工智慧安全日益增長的影響

最近,一位美國人工智慧政策專家指出:「如果你不探索有效利他主義(EA)的影響,你就錯過了重要的故事。」經過反思,我意識到我上周的報導忽略了一個重要的觀點。

具有諷刺意味的是,我以為我關於確保大型語言模型(LLM)權重的文章是個簡單的成功。最近的白宮人工智慧行政命令要求基礎模型公司記錄雙用途基礎模型的所有權和安全措施,使這一主題變得及時且相關。在我的文章中,我訪問了Anthropic的首席資訊安全官Jason Clinton,他強調了確保Claude模型權重的關鍵需求。他指出,犯罪分子、恐怖份子及國家對這些複雜模型的訪問可能帶來的危險,並表示「如果攻擊者獲得整個文件,他們就能控制整個神經網絡。」其他前沿公司也分享這些擔憂;OpenAI的新「準備框架」針對限制敏感模型資訊的訪問需求進行了說明。

我還與RAND公司作者Sella Nevo和Dan Lahav進行了對話,他們撰寫了一份名為《保護人工智慧模型權重》的重要報告。Meselson中心負責人Nevo警告,人工智慧模型可能很快會對國家安全造成重大影響,包括在生物武器開發中的潛在誤用。

有效利他主義與人工智慧安全的網絡聯繫

回顧我的文章,我沒有涵蓋有效利他主義社群與新興的人工智慧安全領域之間的微妙聯繫。考慮到EA日益增長的影響力,這一疏漏尤其值得注意。EA是一場強調利用理性和證據來造福人類的知識運動,特別是在防止先進人工智慧帶來的生存風險方面。批評者認為,EA專注於此類遙遠威脅,忽略了AI開發中的偏見、錯誤信息和網絡安全等迫切問題。

最近,由於OpenAI董事會參與解僱CEO Sam Altman,EA成為新聞焦點,凸顯了EA在高風險決策中的聯繫。

儘管我知道Anthropic與EA之間的聯繫——FTX創始人Sam Bankman-Fried曾在該初創公司持有5億美元的股份——但我仍未深入探討此對我報導的影響。然而,在閱讀了一篇恰好次日發表的Politico文章後,我揭示了RAND與EA之間的關鍵聯繫,包括顯著的資金關係。

該Politico文章顯示,RAND公司的研究人員對白宮的模型權重行政命令的形成發揮了重要作用,且該組織從一個由Facebook共同創始人Dustin Moskovitz支持的EA倡議Open Philanthropy獲得了超過1500萬美元的資金。值得注意的是,RAND CEO Jason Matheny和高級科學家Jeff Alstott被認為是認可的有效利他主義者,並且與拜登政府有過關聯。

有效利他主義社群的見解

在與Nevo的後續對話中,他指出,EA倡導者在人工智慧安全中的強大存在並不意外。歷史上,EA一直在人工智慧安全的討論前沿,這意味著任何參與該領域的人都很可能接觸過EA的觀點。

Nevo還對Politico文章的語氣表示不滿,認為這不公正地暗示了錯誤行為,同時突顯了RAND在為政策制定者提供價值研究方面的長期角色。他強調,他自己及其中心並未參與行政命令的制定,且有關模型安全的條款是白宮事先建立的自願承諾。

雖然Meselson中心仍相對默默無聞,Nevo表示這是RAND許多研究中心之一,專注於生物監控和人工智慧與生物安全的交集。

有效利他主義在人工智慧安全中的重要性

有效利他主義的影響真的重要嗎?回想Jack Nicholson的經典語錄「你需要我在那裡!」,這提出了一個問題:如果我們需要專門從事人工智慧安全的人士,他們的意識形態是否重要?

對許多倡導人工智慧透明度和有效政策的人來說,答案是肯定的。如同Politico報導EA在華盛頓影響力所強調的,這些聯繫將在未來的政策、法規和人工智慧發展中產生重大影響。

我所交談的美國AI政策專家觀察到,許多政策界人士忽視了AI中的潛在意識形態議程。不幸的是,他們低估了它們的影響力。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles