最近、YouTubeチャンネル「WVFRM Podcast」では、OpenAIが開発した革新的なビデオ生成モデル「Sora」に関する核心チームのインタビューが行われました。プロジェクトリーダーのビル・ピーブルズ、ティム・ブルックス、アディティヤ・ラメッシュは、Soraの現状と今後の方向性について貴重な洞察を提供しました。
彼らは、Soraが現在、ユーザーフィードバックの段階にあり、まだ完全な製品には至っていないことを強調しました。そのため、近い将来一般向けに提供されることはなく、完全な形に進化するための具体的なタイムラインも設定されていないと述べています。
Soraの動作原理について説明する中で、チームは膨大なビデオデータを分析し、リアルなビデオを生成する方法を学習していると指摘しました。この技術は、GPTのような大規模言語モデルとDALL-Eのような拡散モデルの能力を組み合わせています。SoraのフレームワークはGPTに近いですが、トレーニング技術はDALL-Eに似ています。
Soraのトレーニングデータのソースについては、公開されているデータセットとOpenAIが承認したものの組み合わせを利用していることのみが明かされました。Soraがテキストプロンプトから比較的高品質なビデオを迅速に生成できるという報告もある一方で、業界の専門家は、現在のAIツールの限界を指摘し、人間のクリエイターの仕事を完全に代替することはできないと述べています。
映画コンセプトアーティストのリード・サウゼンは、「多くの人がハリウッドの終焉を信じていますが、私は違った見方をしています。ハリウッドの制作プロセスは複雑で、生成されたビデオには、特に時間的一貫性やその他の詳細に関して、多くの課題が残っています」と語っています。