Pika、AI搭載のリップシンク機能を発表|動画業界の競争を加速する新技術

OpenAIのAI動画生成モデル「Sora」は、新しいデモ例を披露し、観客を魅了し続けていますが、一般の利用者にはまだアクセスが限られています。その一方で、競合他社のPikaは、サブスクリプション会員向けに「Lip Sync」というエキサイティングな新機能を導入しました。

この革新的な機能は、ElevenLabsという別の音声生成スタートアップからのAI音声を使用して、ユーザーの動画にセリフを追加できるものです。また、セリフに合わせて口の動きを同期させることで、キャラクターのリアリズムを高めます。PikaのLip Syncは、テキストから音声への変換と音声トラックのアップロードオプションを提供し、ユーザーはPikaが生成するキャラクターのためにセリフを入力したり録音したりして、声のスタイルをカスタマイズできます。

現在、Lip Syncは「早期アクセス」段階にあり、Pikaのプロユーザー(年間696ドル、月額58ドル)およびDiscordの招待制「スーパーカラボレーター」プログラムのメンバーのみが利用可能です。

映画制作におけるAIの新たな扉を開く

PikaのAI生成動画は、OpenAIのSoraや競合のRunwayと比べてリアリズムに欠けるかもしれませんが、Lip Sync機能は大きな進歩を意味しています。これは、AIを使った長編映画制作における残された課題の一つに対する解決策を提供しています。多くの主要AI動画生成ツールは、このようなネイティブ機能を持っていません。

これまで、ユーザーはダイアログを追加し口の動きを同期させるために煩雑なサードパーティツールや手間のかかるポストプロダクション手法に頼ってきましたが、その結果、低予算な仕上がりとなることが多かったのです。

最近のニュースでは、Runwayが先月発表した「マルチモーションブラシ」機能を更新しました。このツールは、動画内のさまざまなオブジェクトに最大五つの独立した動作方向を適用することができ、例えば犬がフリスビーを追いかける場面をリアルに表現します。新機能には領域検出が含まれており、動作を適用するオブジェクトを自動で選択できるようになっていますが、手動での「ペイント」オプションも利用可能です。

Pikaもユーザーが動画コンポーネントを編集し、キャンバスを拡張できる機能を提供しますが、現状ではブラシツールが不足しているため、Runwayと比べて精度の高い動作制御には至っていません。

AIトレーニングデータに対する懸念

Pikaの新機能に対する期待が高まる一方で、その動画モデルのトレーニングデータについての疑問も残っています。AI認証非営利団体Fairly TrainedのCEO、エド・ニュートン=レックス氏は、SNSで創作者やデータ所有者の同意がAIトレーニング中に必要であることを強調しました。

動画AI生成企業が革新を続けている中、競争が激化しており、ユーザーには恩恵をもたらす一方で、映画制作業界の一部に懸念を抱かせています。特に映画監督のタイラー・ペリー氏は、Sora生成動画を目にした後、800百万ドルのスタジオ拡張計画を中止したことに対し、テクノロジーによる雇用喪失の懸念を表明し、批判を浴びました。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles