ロンドンのスタートアップ、Synthesiaは、企業がプロフェッショナルなAIビデオを作成するための先駆者として、AIビデオアシスタントの導入を発表しました。この革新的なツールは、テキストベースの情報を数分以内に完全に合成されたビデオに変換します。
AIビデオアシスタントの機能
現在、料金を支払っている顧客向けに利用可能なこのAIビデオアシスタントは、既存の機能を一層強化し、あらゆる文書やウェブリンクに対応。社内外の動画制作を効率化します。このツールはコンテンツ配信を大幅に向上させる一方で、AI生成ビデオやディープフェイクの使用が問題視されることもあります。特に公人に関して誤解を招く恐れがあります。
Synthesiaは2017年にUCL、スタンフォード大学、TUM、ケンブリッジ大学などから集まった多様なチームによって設立され、カスタムAIボイスやリアルなアバターを作成するためのエンドツーエンドプラットフォームを提供しています。ユーザーは既存のアバターの中から選ぶことも、自分だけのアバターをカスタマイズすることも可能です。
従来の動画制作はスクリプト作成や動画レイアウト設計など多くの労力を要しますが、新しいAIビデオアシスタントはこのプロセスを簡素化します。ユーザーはウェブサイト、テキストファイル、Word文書、PDF、またはコンセプトを素材として入力し、ビデオの目的、シーン数、言語、スピーカーのトーンに応じたテンプレートを選ぶだけで済みます。
コンテンツ配信体験の向上
Synthesiaの製品マネージャーであるサンダー・ソライ氏は、「AIビデオアシスタントは、ユーザーの入力とビデオの目的、聴衆、その他の仕様を合成するために生成AIを利用しています。大規模言語モデルが、ユーザーが選択したテンプレートに基づいてスクリプトや関連シーンレイアウトを生成します」と述べています。このプロセスにより、数分内に結果が得られ、初期のスクリプトが不十分であってもすぐに修正が可能です。ユーザーは設定を再構成し、出力の質を向上させることができます。
Insiviaの報告によれば、視聴者はビデオを通じて伝えられたメッセージの95%を記憶する一方で、テキストで読んだ場合はわずか10%です。それでも、多くの組織は依然として長大なハンドブックやPDFに依存しており、重要な情報を伝えています。AIビデオアシスタントは、このギャップを埋める役割を果たし、さまざまな人が複雑なテキストを容易に高品質なビデオに変換できるようになります。
深刻な懸念の中での成長
AI生成メディアのリスクに関する議論が続く中、Synthesiaは企業部門で繁栄しています。同社は300人を雇用し、2023年6月に9000万ドルを調達。フォーチュン100企業の半数を含む55,000以上の企業にサービスを提供しています。顧客の中にはZoomがあり、トレーニングビデオ制作が90%速くなったと報告しています。
Synthesiaの法人担当ディレクター、アレクサンドル・ヴォイカ氏は、「これによりZoomの専門家は、録画にかかっていた毎月15〜20時間を他の業務に充てることができ、従業員一人当たり毎月1,000〜1,500ドルのコスト削減が実現しました」と述べています。また、Synthesiaはプラットフォームの速度を向上させ、次世代のアバター技術を開発中で、より自然な表情や改善された声、多様なカスタマイズを提供する予定です。この進歩により、SynthesiaのAI生成ビデオはさらにリアルな体験に近づくことでしょう。競合にはDeepbrain AI、Rephrase、HeyGenなどがあります。