GoogleDeepMind:人間とのつながりを強化し、AIパフォーマンスを向上させる

人間がポジティブな強化で成長するように、AIも人間の相互作用を模倣したアドバイスから恩恵を受けることができます。Google DeepMindの研究者たちは、日常的な人間のコミュニケーションを模倣したプロンプトを通じて、大規模言語モデルの数学的能力を大幅に向上させる画期的なアプローチを導入しました。この革新的な手法は、彼らの論文「大規模言語モデルを最適化ツールとして使用する(Large Language Models as Optimizers)」に詳述されており、最適化をプロンプトによって行う(Optimization by PROmpting、略称OPRO)として知られています。

OPROは自然言語を活用して、OpenAIのChatGPTのような大規模言語モデルが複雑な問題に取り組む際の指針となります。従来の機械学習は、パフォーマンスを向上させるために形式的な数学的プロセスに依存していますが、OPROは親しみやすい会話形式の言語を通じて改善をスタートさせます。問題の説明と過去の応答を解釈しながら、言語モデルは可能な解決策を生成します。

ジョンズ・ホプキンス大学のオペレーションマネジメントおよびビジネスアナリティクスの教授、ティンロン・ダイは、「大規模言語モデルは人間が生成したコンテンツで訓練されており、その仕組みは良いカップルのようにあなたの文を完成させることです。したがって、人間らしいプロンプトが良い結果を導くのは驚くべきことではありません」と説明しています。これは、プロンプトの表現がAIのアウトカムに大きく影響することを示しています。

DeepMindの研究では、特定のフレーズがモデルのパフォーマンスに顕著な影響を与えることが明らかになりました。例えば、「ステップバイステップで考えましょう」といったプロンプトは、データセットに対する数学問題の解決精度を向上させる結果をもたらしました。特に「深呼吸して、この問題をステップごとに解決しましょう」というフレーズは、GoogleのPaLM 2で最良の結果を得ることができ、GSM8Kという小学生向けの数学ワードプロブレムのデータセットに対して80.2%の精度を達成しました。それに対し、具体的なプロンプトなしではPaLM 2は34%にとどまり、「さあ、ステップバイステップで考えましょう」とのプロンプトでは71.8%でした。

ペンシルベニア大学のコンピュータサイエンスおよび情報科学の教授、マイケル・カーンは、大規模言語モデルが会話データとして訓練されているため、人間らしいプロンプトに基づいて応答を修正するのが得意だと指摘しています。また、数学や論理の問題を扱う際には、これらのモデルを段階的に分解することが重要であり、数学的証明や形式的な推論までを含むデータに基づくトレーニングが支えています。

DeepMind論文の共著者、チェングルン・ヤンは、ほとんどの大規模言語モデルは膨大なデータセットで訓練されており、パラフレーズや文の強化といった自然言語処理能力を強化されていることを説明しています。モデルの整合性を高めるための継続的な努力が、AIが人間らしいプロンプトに効果的に反応する能力を向上させています。

SmartlingのAIおよび機械翻訳担当副社長、オルガ・ベレゴヴァヤは、人間らしいプロンプトがAIとの対話をより導くリクエストの形を取ることが多いと述べています。「大規模言語モデルは、より多くのコンテキストが与えられるほど効果的に実行されます」と彼女は付け加えています。詳細なプロンプトは、モデルが提供された特定のコンテキストにより密接に応じるようになります。

興味深いことに、簡単な励ましの言葉もAIのパフォーマンスを高める効果があります。ダイは「『頑張れ、もっといい結果が出せるよ!』と言うことで、より良い結果が得られるかもしれない」と指摘しています。例えば、ノーベル賞受賞経済学者の役割を模倣するように求めることで、インフレーションのような複雑なトピックに関する洞察に満ちた議論が生まれることがあります。また、医療診断のシナリオでは、著名な医療専門家の姿勢を取るように促すことで、より正確で焦点を絞った結果が得られるかもしれません。ただし、これらの人間的な励ましが効果的である一方で、すべてのタスクに対する普遍的な改善が保証されるわけではないとも述べています。

重要なのは、特定のタスクに合わせた非人間的なプロンプトにも大規模言語モデルが良好に反応する可能性があるということです。ダイは構造化され、コーディングされたプロンプトが効果的な結果をもたらすことを言及し、従来の会話形式とは対照的なアプローチを提供します。

OPRO手法は、AIプロンプトのエンジニアリングプロセスを簡素化し、ユーザーが数学の問題解決精度、ツールのトリガー率、テキスト生成の創造性など、さまざまな指標に基づいてクエリを最適化できるようにします。ヤンは、この方法が大規模言語モデルを使用してより広範なタスクを強化する新しいアプリケーションのインスピレーションとなることを期待しており、よりインタラクティブで効率的なAIソリューションへの道を開くことを目指しています。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles