設立からわずか2年で、元GoogleおよびPalantirの従業員によって設立されたAI音声スタートアップのElevenLabsは、ユニコーン企業としての地位を確立しました。同社は最近、8000万ドルのSiriーズB資金調達ラウンドを発表し、評価額を10倍の11億ドルに引き上げました。この投資は、既存の出資者であるAndreessen Horowitz(a16z)、元GitHub CEOのナット・フリードマン、元Apple AIリーダーのダニエル・グロースの共同主導により、Sequoia CapitalやSV Angelの貢献も受けています。この資金調達は、約6ヶ月前に実施された1900万ドルのSiriーズAラウンドに続くもので、当時のElevenLabsの評価額は約1億ドルでした。
AIボイステクノロジーの先駆者
ElevenLabsは、機械学習を活用した音声のクローン化と合成を多言語で行うことに特化しています。この新たに獲得した資金は、研究と製品開発を強化するために使用されます。同社は、長編映画用のダビングツールや、ユーザーがクローン音声を販売できるマーケットプレイスなど、いくつかの新機能を発表しています。
コンテンツを普遍的にアクセス可能に
方言や言語が多様であるため、従来のローカライズされたコンテンツ制作は主にメインストリームな言語に焦点を当て、手動ダビングに依存してきました。Poland出身の創業者であるピョトル・ダブコフスキとマティ・スタニゼフスキは、劣悪なダビングの問題を目の当たりにし、ElevenLabsを創設しました。彼らのミッションは、AIを活用してコンテンツへのアクセスを民主化することです。
2022年の設立以来、ElevenLabsは重要なマイルストーンを達成しました。最初は英語の自然な音声テキスト変換モデルで認知され、その後、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ポルトガル語、ヒンディー語などを支持するEleven Multilingualバージョン1および2を通じて機能を拡張しました。Voice Lab機能では、ユーザーが自分の声をクローンしたり、合成音声を生成したりして、テキストを音声コンテンツに変換できます。
スタニゼフスキは、「ElevenLabsの技術は、文脈を理解し、高い圧縮率を活用して非常にリアルなスピーチを提供します。我々の独自モデルは、単語の関係を理解し、文脈に基づいて配信を調整し、何千もの音声特性を動的に予測します」と説明しました。
増加するユーザー基盤
数ヶ月のうちに、ElevenLabsは100万人以上のユーザーを惹きつけました。音声から音声への変換ツールであるAI Dubbingの導入により、コンテンツクリエイターは音声と動画を29言語に翻訳し、元のスピーカーの声や感情を保持することが可能です。注目すべきは、フォーチュン500の41%が同社のクライアントであり、Storytel、The Washington Post、TheSoul Publishingなどの著名な出版者が含まれています。
スタニゼフスキは、「現在、我々は100以上のB2Bパートナーシップを築いています。AI音声は、観客体験の向上から教育機会の拡大まで、幅広い用途があります」と言います。
ダビングスタジオの導入
ElevenLabsは、新たにダビングスタジオワークフローを導入し、AI Dubbingツールを強化します。この新しいワークフローは、専門家が多言語で長編映画をダビングするための強力なツールを提供し、トランスクリプトや翻訳、タイムコードの生成・編集を可能にします。ただし、現在はリップシンクが含まれておらず、元の動画の口の動きはそのままです。
新しいマーケットプレイスとアクセシビリティ機能
さらに、ElevenLabsはテキストやURLを音声に変換するアクセシビリティアプリと、ユーザーがAIクローン音声を monetizationするためのVoice Libraryを発表します。ユーザーは、利用可能性や報酬の条件を設定でき、共有するには信頼性を確保するための多段階の確認プロセスが必要です。
「音声確認は、音声がトレーニングサンプルと一致するかを確認するためのキャプチャプロセスを含み、我々のモデレーションチームがサポートします」とCEOは述べました。
これらの機能は今後数週間内に利用可能になる予定で、ElevenLabsはさまざまな分野からのユーザーを惹きつけることを目指しています。この資金調達により、総額は1億100万ドルに達し、同社はAIボイステクノロジーの研究基盤を強化し、対象製品を開発し、AI音声分類器を含む強力な安全対策を実施する計画です。
スタニゼフスキは、「今後数年間で、我々は音声AIの研究と製品展開における世界的リーダーとしての地位を確立することを目指します」と述べました。
AI音声生成分野の競合にはMURF.AI、Play.ht、WellSaid Labsなどがあります。Market USによれば、これらのツールの世界市場は2022年に12億ドルと評価され、2032年までに50億ドルに近づくと予測されており、年平均成長率(CAGR)は約15.4%になる見込みです。