OpenAIがついに開発者待望のトップ機能を発表!

JavaScript Object Notation(JSON)は、人間にとって読みやすく、機械が解析可能な業界標準のファイル形式であり、データのやり取りに広く使用されています。しかし、大規模言語モデル(LLM)はJSONを扱う際に課題が多く、幻想的な内容を生み出したり、指示に部分的にしか応じない応答を生成したりすることがあります。また、JSONを正しく解析できないこともあります。このため、開発者はオープンソースツールや複数のプロンプト、または繰り返しのリクエストなどの回避策を使わざるを得ないことがよくあります。

構造化出力:開発者のためのソリューション

OpenAIは、APIに新たに「構造化出力」機能を導入し、これらのフラストレーションを解消しました。この機能は、モデルが生成する出力がJSONスキーマに従うことを保証します。JSONスキーマは、JSON文書の内容、構造、データ型、制約を定義します。この機能は開発者からの要望が最も多かったもので、一貫性の向上に寄与する重要な役割を果たします。CEOのSam Altman氏も、「大変な要求に答えたリリース」としてこの機能を強調しました。

評価において、OpenAIの新しいGPT-4oモデルは、構造化出力において100%の完璧なスコアを達成しました。この発表は、ジョン・シュルマン、グレッグ・ブロックマン、ピーター・デンという主要幹部の突然の辞任や、エロン・マスクによる企業に対する法的課題に関連した「シェイクスピア的な裏切り」と見なされる出来事があった一週間の後に行われました。

スキーマ遵守を簡単に強化

JSONは、さまざまなプログラミング言語と互換性があり、柔軟で広く使用されているデータストレージ・交換フォーマットです。OpenAIは、昨年のDevDayで開発者からのニーズに応じてJSONモードを導入しました。

構造化出力機能により、開発者はOpenAIモデルを定義されたスキーマに厳密に従わせることができます。この機能は、複雑なスキーマの理解を向上させることをOpenAIは述べています。「構造化出力はJSONモードの進化版です。両者が有効なJSONを生成する一方で、構造化出力はスキーマ遵守を保証します」と同社のブログで説明されています。この進展により、必要なキーの省略や無効な列挙値に関する懸念が軽減され、プログラムのメンテナンスが簡素化されます。

開発者は、構造化出力を活用して出力を段階的にガイドでき、誤ってフォーマットされた応答を再検証したり再送したりする必要がなくなります。この機能により、プロンプトが簡素化され、不正確なリクエストには明示的に拒否されることで、OpenAIの安全性へのコミットメントが維持されます。

利用可能性と互換性

構造化出力は、GPT-4o-mini、GPT-4o、およびこれらの微調整版で利用可能です。Chat Completions API、Assistants API、Batch APIで使用でき、ビジョン入力もサポートしています。OpenAIは、この新機能がオープンソースコミュニティの素晴らしい取り組みに触発されていることを認めており、特にoutlines、jsonformer、instructor、guidance、larkライブラリからの影響を挙げています。

この構造化出力の導入により、開発者がJSONスキーマに基づいた一貫性のあるデータ構造を作成しやすくなり、アプリケーションの互換性が向上します。

Most people like

Find AI tools in YBX