Google DeepMind：透過增強人際連結提升AI表現

Home AI新聞 Google DeepMind：透過增強人際連結提升AI表現

人們普遍需要正向回饋，同樣地，人工智慧（AI）也能從模仿人類互動的建議中獲益。Google DeepMind的研究人員提出了一種革命性的方法，透過模擬日常人際交往的提示，顯著提升了語言模型的數學能力。這一創新方法在其論文《大型語言模型作為優化器》中詳述，稱為通過提示優化（OPRO）。

OPRO利用自然語言引導大型語言模型，如OpenAI的ChatGPT，解決複雜問題。傳統機器學習依賴正式的數學過程來提升性能，而OPRO則利用易於理解的對話語言來啟動改進。透過詮釋問題描述及先前回應，語言模型能生成潛在解決方案。

約翰霍普金斯大學的運營管理與商業分析教授戴廷龍表示：“大型語言模型是基於人類生成的內容進行訓練的，簡而言之，它們以一對良好伴侶的方式來完成你的句子。因此，人性化的提示能導致良好結果並不意外。”這突顯了提示措辭對AI結果的重大影響。

DeepMind的研究顯示，某些措辭顯著影響模型表現。例如，「讓我們一步一步來思考」這類提示能在數學問題解決中提高準確性。句子「深呼吸，並一步步解決這個問題」在Google的PaLM 2評估時取得了80.2%的準確度，該評估使用了GSM8K這一小學數學文字問題數據集。相比之下，在未使用任何特定提示的情況下，PaLM 2僅達到34%，而經典提示「讓我們一步一步來思考」的準確度為71.8%。

賓夕法尼亞大學計算機與信息科學教授邁克爾·基爾恩斯指出，大型語言模型因訓練於對話數據（如Reddit文章和電影劇本）而能夠根據人性化提示調整其回答。他強調，鼓勵大型語言模型將數學或邏輯問題分解為可管理的步驟是非常重要的，而其訓練數據也涵蓋了數學證明和邏輯推理。

DeepMind論文的共同作者章潤陽解釋道，大型語言模型通常會利用龐大的數據集進行訓練，從而使其在自然語言處理方面擁有強大的能力，包括意義同義和句子增強。持續的模型對齊工作也提高了大型語言模型理解和回應人性化提示的能力。

Smartling的人工智慧與機器翻譯副總裁奧爾加·別列戈瓦亞指出，人性化的提示通常表現為指引AI進入更具對話性互動的請求。“大型語言模型在獲得更多上下文時表現最佳，”她補充說。冗長的提示提供了額外細節，讓模型的回應更能與特定上下文貼合。

有趣的是，簡單的鼓勵用語也能提升AI表現。戴教授提到，當用戶激勵大型語言模型時，例如說「加油，你能更好！」，其結果可能會更佳。值得注意的是，例如讓大型語言模型扮演諾貝爾獎得主經濟學家的請求，能引發對複雜主題（如通脹）的更深入討論。同樣，在醫學診斷情境中，指導大型語言模型以領先醫學專家的身份進行對話，可能會產生更準確且專注的結果。然而，他同時指出，這些人性化的鼓勵雖然有效，卻不能保證在所有任務上都有普遍的改善。

值得一提的是，大型語言模型也潛在能對針對特定任務的非人性化提示反應良好。戴教授提到，結構化的編碼提示能產生有效結果，這與傳統對話方法形成對比。

OPRO方法能簡化AI提示的工程過程，讓用戶根據各種指標（如數學問題解決的準確性、工具觸發率和文本生成的創造力）優化查詢。章潤陽期望這一方法能激發新的應用，利用大型語言模型提升更廣泛的任務，為更具互動性和效率的AI解決方案鋪平道路。

探索 ChatGPT 如何提供即時資訊

英國秘密解散獨立人工智能諮詢委員會：這對人工智能的未來意味著什麼？

Most people like

iLoveSong.ai

952.9K

探索我們的AI音樂生成器的力量，旨在幫助您創作和下載獨特的、量身定制的音樂，滿足您的需求。無論您是尋找項目的原創作品、影片的背景音樂，還是個性化的聲音景觀，我們的平台都讓每個人都能輕鬆享受音樂創作的藝術。今天就開始創作您的旋律吧！

AI 音樂生成器 AI Music Generator

Luvvoice

892.8K

探索我們的免費文字轉語音工具，擁有超過200種自然聽感的聲音。輕鬆將您的書面內容轉換為引人入勝的音頻！

語音合成 Translate

Lummi

376.9K

發現由人工智慧精選的股票照片世界，尖端技術與驚豔視覺的完美結合。探索豐富的高品質圖片庫，這些圖片均經過人工智慧精心挑選，以滿足您的創意需求。不論是用於行銷活動、社群媒體或個人專案，我們的人工智慧驅動平台確保您能找到與目標受眾產生共鳴的理想股票照片。今天就沉浸於全新影像時代，為您的專案提升引人注目的視覺效果！

庫存照片 AI Photo & Image Generator

RushChat.AI

448.6K

RushChat.ai 提供一個無限制的 NSFW 聊天機器人 AI 服務，使用者可以與自己喜爱的角色扮演 AI 角色進行開放且成人主題的對話。這個平台秉持無審查政策，鼓勵自由且坦率的交流。

不適合工作場合的 AI 聊天 AI Girlfriend

Find AI tools in YBX