OpenAIは、AIモデルの強化を目的として、特定の領域に特化したユニークなデータを積極的に収集しています。これにより、さまざまなテーマやコンテキストに対するより深い理解を目指しています。新たに立ち上げた「OpenAIデータパートナーシッププログラム」は、公共の寄付を募り、GPT-4や新たに発表されたGPT-4 Turboのトレーニングに不可欠な、公共および私的なデータセットを収集しています。
OpenAIは、オンライン上で簡単には入手できない人間社会を表現する大規模なデータセットの収集に特に力を入れています。この取り組みは、テキスト、画像、音声、動画などさまざまなメディアを網羅しています。組織は、断片的なデータポイントではなく、人間の意図を表現した長文や詳細な会話を含むデータセットを求めています。
現在、OpenAIは言語能力を向上させるために、さまざまな組織と協力しています。例えば、アイスランド政府やMiðeind ehf.との共同プロジェクトでは、GPT-4のアイスランド語の能力向上を目的とした専門的なデータセットの開発に取り組んでいます。さらに、Free Law Projectとのパートナーシップでは、膨大な法的文書のコレクションを活用してAIトレーニングを充実させ、法的知識へのアクセスを民主化することを目指しています。
データパートナーシッププログラムの目標は、さまざまな組織がAI技術の発展に影響を与えることを可能にし、提供されるコンテンツに基づいて、より関連性があり役立つものにすることです。この共同作業は、人間の経験や社会のニーズの複雑さを反映した多様なデータセットと関わる重要性を強調しています。
また、OpenAIはデータ収集における倫理的な取り組みを固守しています。敏感な個人情報や第三者のデータをデータセットに含める意向はないと明言しており、オープンソースのデータセットを作成することに焦点を当てています。これにより、広範なAIコミュニティが利用できるデータが作成される一方で、特定の用途向けの私的データセットも準備される可能性があります。
さらに、OpenAIのCEOであるSam Altmanは、企業クライアントとのカスタムAIモデルの開発に向けた計画を最近発表しました。初めは多くの企業にとってコストが高くなる可能性があるものの、独自のソリューションに投資できる企業にとっては画期的な進展の可能性があると強調しました。また、新しいモデルやアップデートの発表後に興味が高まったことから、需要の増加とサービスの変動が見られることも指摘しています。
関連する中で、OpenAIはChatGPTがDDoS攻撃に直面したが、2日で完全機能を回復したと確認しました。この出来事は、AI技術への関心と利用が高まっていること、さらに急速な成長と興味に伴う課題を浮き彫りにしています。