シンセシア、AI動画技術を進化させ「表現豊かなアバター」でエンゲージメントを向上

ロンドンに本拠を置くスタートアップ、Synthesiaは、企業向けのAI動画制作を専門とし、プラットフォームに「エクスプレッシブアバター」を導入しました。これにより、今日からAIアバターは従来のデジタルアバターの機能をさらに進化させ、コンテンツの文脈に応じてトーン、表情、身体言語を調整できます。この発表は、Microsoftが人間の顔写真を表情や頭の動きがあるアニメーション動画に変えるAIフレームワークVASAを披露した直後に行われました。ただし、VASAは研究プロジェクトにとどまっているのに対し、Synthesiaのエクスプレッシブアバターは、企業がよりリアルなAI動画を作成できる実用的な技術を提供します。

Synthesiaの革新

Synthesiaは、2017年にスタンフォード大学とケンブリッジ大学のAI研究者や起業家によって設立され、カスタムAI音声とアバターを組み合わせたエンドツーエンドプラットフォームを開発しました。ユーザーは、事前に書かれたスクリプトやAI生成のコンテンツを使用してスタジオ品質のAI動画を制作でき、企業での採用が進んでいます。現在、20万人以上のユーザーが1800万本以上の動画を制作していますが、従来のアバターはリアルタイムでトーンや表情を変更できないため、感情をうまく伝えることができませんでした。しかし、エクスプレッシブアバターの導入によって、この制約が解消されました。

新しいAIアバターは、テキスト内の感情や文脈を理解し、それに応じてトーンや表情を調整します。たとえば、喜ばしい話題については微笑み、悲しい内容ではより長めの間を取って話すことができます。SynthesiaのCTOであるジョン・スターク氏は、「私たちの目標はデジタルレンダリングを作成するだけでなく、デジタル俳優を導入することです。この技術はデジタルアバターのリアリズムを高め、バーチャルとリアルの境界を曖昧にします」とブログで述べています。

エクスプレッシブアバターの技術的基盤

この高度な感情理解を実現するために、Synthesiaは広範なテキストと動画データを学習させた深層学習モデル「EXPRESS-1」を使用しています。スターク氏は、「EXPRESS-1は、発話のニュアンスと強調に完璧に整合した動きと表情をリアルタイムで予測し、非常に自然なパフォーマンスを実現します」と説明しています。また、新しいアバターは、複数の言語において改良されたリップシンクと音声機能も備えています。

エクスプレッシブアバターの影響

人間のような感情を持つAIアバターは、悪用のリスクも考えられますが、Synthesiaはコミュニケーションや知識共有におけるポジティブな企業アプリケーションの促進に尽力しています。例えば、医療機関はより共感的な患者向け動画を制作するためにエクスプレッシブアバターを活用し、マーケティングチームは新製品に対する熱意を伝えられるでしょう。

責任ある利用を促進するために、Synthesiaはプラットフォーム上のコンテンツタイプに制限を設けるなど、方針を見直し、悪用の早期検出やコンテンツ検証技術(C2PA)への投資を進めています。現在、Synthesiaは300人のスタッフを擁し、フォーチュン100の半数を含む55,000以上の企業と協力しています。Zoomは、Synthesiaを使用することで、営業やトレーニング動画の作成効率が90%向上したと報告しています。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles