OpenAIは、第三者開発者が独自に大規模マルチモーダルモデル(LMM)であるGPT-4oをファインチューニングできる新機能を発表しました。このカスタマイズにより、開発者はモデルの動作を調整し、アプリケーションや組織の特定のニーズにより適したものにできます。
ファインチューニングにより、トーンの調整、特定のガイドラインの遵守、技術的なタスクの精度向上が可能となり、限られたデータでも効果を発揮します。この機能に興味のある開発者は、OpenAIのファインチューニングダッシュボードにアクセスし、[「作成」]を選択した後、ベースモデルのドロップダウンメニューからgpt-4o-2024-08-06を選んで開始できます。この発表は、より小型で高速なバリアントであるGPT-4o miniの導入に続くもので、こちらもファインチューニングが可能ですが、性能は制限されています。
OpenAIの技術スタッフであるジョン・アラードとスティーブン・ハイデルは、ブログで「ファインチューニングは、コーディングからクリエイティブライティングまで、さまざまな分野でモデルのパフォーマンスを大幅に向上させる可能性があります。これは始まりに過ぎません。今後も開発者向けのカスタマイズオプションを拡大していきます」と述べています。
無料トークンの提供(9月23日まで)
OpenAIは、開発者が数十件のトレーニング例だけで印象的な結果を得られることを強調しています。この新機能の開始を祝うために、2024年9月23日まで、ファインチューニングのために最大100万トークンを無料で提供します。
トークンは概念の数値表現であり、モデルの入力と出力プロセスに欠かせません。開発者は、GPT-4oを効果的にファインチューニングするためにデータをトークンに変換(トークナイゼーション)する必要があります。ファインチューニングは通常、100万トークンごとに25ドルの費用がかかりますが、ファインチューニングされたモデルの運用には、入力トークン1百万あたり3.75ドル、出力トークン1百万あたり15ドルが必要です。小型のGPT-4o miniを利用する開発者には、9月の期限まで毎日最大200万トークンが無料で提供され、ファインチューニング機能へのアクセスが広がります。
OpenAIの無料トークン提供は、GoogleやAnthropicなどの競合や、MetaのLlama 3.1を基にしたNous Researchのオープンソースモデルに対抗するための措置です。しかし、OpenAIのモデルを使用する開発者は、自分たちのサーバーで推論やトレーニングを行う必要がなく、OpenAIのインフラを利用したり、APIを通じて自分のサーバーに接続したりする便利さを享受できます。
成功事例が示すファインチューニングの可能性
GPT-4oのファインチューニング機能は、特定のパートナーとの広範な試験を経てリリースされたもので、さまざまな分野でのカスタムチューニングモデルの可能性を示しています。たとえば、AI企業のCosineは、ファインチューニングした自律型AIエンジニアエージェント「Genie」でSWE-benchベンチマークで43.8%という最高の結果を達成し、公開されているAIモデルの中での最高記録を樹立しました。
同様に、Fortune 500企業向けのAIソリューション提供会社Distylも、ファインチューニングしたGPT-4oでBIRD-SQLベンチマークのトップランクを獲得し、71.83%の実行精度を達成しました。このモデルは、クエリの再構成や自己修正を含むSQLタスクにおいて卓越した性能を発揮しました。
ファインチューニングにおける安全性とデータプライバシーの重視
OpenAIは、カスタマイズオプションの拡大に際して、安全性とデータプライバシーが最も重要であると強調しています。ファインチューニングされたモデルは、組織にデータの完全な制御を提供し、入力や出力が他のモデルのトレーニングに使用されないようにしています。
OpenAIは、ポリシーの遵守を維持するための自動評価や利用監視など、複数の安全対策を実施しています。しかし、研究によると、ファインチューニングは時に安全プロトコルからの逸脱をもたらし、モデルの全体的なパフォーマンスに影響を及ぼすことがあります。最終的には、組織はファインチューニングの潜在的なリスクと利点を慎重に天秤にかける必要があります。
ファインチューニング機能の最近の導入により、OpenAIは将来的にほとんどの組織が自社の業界やビジネスニーズに特化したモデルを開発すると考えています。この新機能は、その目的に向けた重要な一歩となり、すべての組織が独自のカスタマイズAIモデルを持つことができるようにするOpenAIのコミットメントを強調しています。