OpenAIは、ChatGPTやLLM企業としての認識を超えて、新たな展開を図っています。本日、同社は革新的なAIテキストから動画を生成するモデル「Sora」を発表しました。共同創設者兼CEOのSam Altman氏は、X(旧Twitter)への投稿でこの発表を「素晴らしい瞬間」と表現しました。
現在、Soraは一般には公開されていません。アルトマン氏は「開始段階のセキュリティテスト」を行っており、潜在的な欠陥や悪用の特定に努めていると説明しました。ただし、限られた創作者がモデルにアクセスできており、将来的には一般公開が期待されています。
競争の激しい市場へ進出
Soraは、現在すでにAI動画生成ソリューションを提供しているスタートアップ(Runway、Pika、Stability AIなど)や、GoogleのLumiereモデルなどの既存の大手企業と競争することになります。
Soraの特徴は、その優れた品質です。OpenAIが公開したサンプル動画は、驚くほどのシャープさ、滑らかな動き、そして人間の体や物理環境の正確な再現を示しています。特に、Soraは60秒の動画を一度に生成できる能力を持ち、RunwayやPikaなどの競合他社が一度にわずか4秒の動画しか生成できないのに対し、圧倒的な性能を発揮しています。
リアルタイムでの呼びかけ
興味深い取り組みとして、アルトマン氏とSoraチーム(研究者ウィル・デピューを含む)は、Xでユーザーからのプロンプトを収集しています。これらの入力を活用し、Soraの能力をリアルタイムで示すクラウドソーシングされたデモンストレーションを作成しています。
日常の瞬間をリアルに表現
Soraは、魅力的なビジュアルだけでなく、日常のシーンを驚くほどリアルに描写することでも優れています。高架電車からの都市の風景や、女性と猫の親密な瞬間など、身近な人間の体験を表現する能力が際立っています。
さらに、OpenAIの研究者ビル・ピーブルズ氏は、「人工汎用知能」(AGI)、すなわち経済的に有価なタスクで人間を超えるAIの実現に向けて、Soraが大いに貢献するだろうと述べています。
AIにとっての重要な瞬間
米国の連邦機関が詐欺やディープフェイクへの懸念からAI規制を強化する中で、Soraの導入はOpenAIだけでなく、テクノロジーとメディア全体にとっての新たなマイルストーンとなります。Soraが社会に与える影響は、良いものか悪いものか、まだ完全には明らかになっていません。