OpenAIが新しいAI動画プラットフォーム「Sora」でのバイラリティの限界を押し広げる中、競争相手たちは自社の提供を向上させるために急ピッチで動いています。最近、Pika Labsがリップシンク機能を発表し、さらに新たなAI動画スタートアップHaiperが、Octopus Venturesから1380万ドルのシード資金を調達し、登場しました。
Haiperは、元Google DeepMindの研究者であるYishu Miao(CEO)とZiyu Wangによって設立されたロンドン拠点の企業で、ユーザーがテキストプロンプトから高品質の動画を作成したり、既存の画像をアニメーション化したりできるプラットフォームを提供しています。このプラットフォームは独自のビジュアル基盤モデルを採用し、RunwayやPika Labsと競争していますが、初期テストではOpenAIのSoraにはまだ及ばないようです。
Haiperは、この資金を活用してインフラや製品機能を強化し、人間の理解を真に反映できる人工一般知能(AGI)の開発に向けた基盤を築くことを目指しています。
Haiperの提供内容
Haiperは、RunwayやPika Labsと同様に、ユーザーが簡単にテキストプロンプトを入力してAI動画を作成できる使いやすいウェブプラットフォームを提供しています。現在、SDおよびHD品質の動画を生成できますが、HDの内容は最大2秒に制限され、SD動画は最大4秒まで作成可能です。低品質オプションでは、動きの制御が可能です。
私たちのテストでは、HD動画の出力は一貫しており、短い時間の影響が大きいと考えられます。一方で、低品質の動画はよくぼやけ、高速動作時には形、サイズ、色の歪みが目立ちました。Runwayとは異なり、Haiperは現在動画の長さを延ばすオプションはありませんが、近い将来にこの機能を追加する予定です。
また、Haiperは既存の画像をアニメーション化し、テキストプロンプトを使用して動画のスタイル、背景、要素を調整する機能を提供しています。同社は、プラットフォームと独自のビジュアル基盤モデルが、ソーシャルメディアのコンテンツ作成からスタジオコンテンツ生成のビジネス用途まで、さまざまな用途に対応できると主張していますが、商業化に関する具体的な計画は明らかにしていません。
AGIに向けたビジョン
Haiperはこの最新の資金調達を通じて、インフラや製品の拡充を図り、包括的な知覚能力を持つAGIの実現に向けた開発を進めます。この投資により、同社の総資金は1920万ドルに達しました。
今後数ヶ月以内に、Haiperはユーザーフィードバックに基づいて提供内容を洗練させ、一連の高度に訓練されたモデルをリリースして動画品質を向上させ、競合との差を縮める計画です。モデルの開発とともに、物理世界の理解度を高め、光、動き、質感、物体間の相互作用を包括する取り組みを進めます。こうした取り組みにより、超リアルなコンテンツ制作が可能になります。
「我々の最終目標は、創造性の無限の可能性を引き出す、完全な知覚能力を持つAGIを構築することです。我々のビジュアル基盤モデルは、現実のダイナミクスを理解するAIの能力において重要な進展を示しており、これが人間のストーリーテリングを豊かにする助けとなるでしょう」とMiaoは述べました。
次世代の知覚能力を備えたHaiperは、コンテンツ制作だけでなく、ロボティクスや輸送分野にも影響を与えることを期待しています。この革新的なAI動画アプローチにより、Haiperはますます注目される企業となっています。