AIハードウェアの理想像とは?
今月の初め、生成AI動画スタートアップ「Runway ML」のCEOであるクリストバル・バレンスエラが、彼のXアカウントに「1stAI Machine」の動画を投稿したとき、この問いが私の頭をよぎりました。バレンスエラはこのデバイスを「AIによって生成された、初の物理的な動画編集装置」と呼び、「近い将来、動画のクオリティは写真と同等になると予想しています。この時期、誰もがカメラや照明、俳優なしで映画を作成できるようになり、AIsと対話するだけで済むでしょう。1stAI Machineのようなツールは、その瞬間を見越して、創造性を高める具象インターフェースを探求しています。」と述べました。
動画には、角ばったマットな銀色の装置が映っていました。それは「初のAI編集ボード」と呼ばれ、物理的なダイヤルやノブを備え、さまざまな入力スタイルを制御できるようになっています。平均的なラップトップよりもかなり大きい印象です。
私は、創造性やメディア制作におけるAIツールを取材するジャーナリストとして、強い興味を持ちました。Runwayはこれまでウェブベースのソフトウェアに特化していましたが、ハードウェアに進出するのでしょうか?もしそうなら、その価格、出荷予定、対象の聴衆は誰になるのでしょう?
AIハードウェアの台頭
先週、Humane社のAi Pinが登場し、699ドルの価格や毎月の24ドルのサブスクリプションに関する賛否が飛び交っています。このマグネットピンは、元Appleエンジニアによって設計され、OpenAIのGPT-4モデルを搭載したライフアシスタントとして機能し、2023年のタイム誌200のベスト発明の一つにも選ばれました。
AIハードウェアの登場は明らかです。それでは、1stAI Machineはどのような位置づけで、誰が開発し、何がインスピレーションの源となったのでしょう?
マシンの背後にあるビジョン
バレンスエラは彼の投稿で「1stAveMachineのためのSpecialGuestX」に言及しました。先週、私はバレンスエラ、SpecialGuestX(SGX)、1stAveMachineにコンタクトを取りました。SGXの共同創設者ミゲル・エスパダから、データ、自動化、AIに関する新しい物語を探求しているという返信を受けました。
彼はマドリードの小さなチームが1stAI Machineを開発したことを確認し、1stAveMachineのブルックリンオフィスでのハンズオンデモをアレンジしました。エスパダはアートにおけるAIの経験が豊富で、彼は後にStable Diffusion AIモデルに進化したDisco Diffusionコミュニティの初期メンバーでした。彼のエージェンシーは以前、Carvana向けにパーソナライズされたAI動画を生成するためにStable Diffusionを適応させていました。
1stAI Machineの入手可能性
現時点で1stAI Machineを手に入れることは期待しないでください。エスパダは、現在はユニークなプロトタイプであり、「売る計画はないが、ハードウェア製品についてはロードマップがある」と述べました。
1stAI Machineは自動車部門のクライアント提案から生まれ、RunwayのGen-2ソフトウェアを使用して新しい車モデルのストーリーボードを生成動画に変換することを目指していました。クライアントがこのアイデアを追求しなかったため、エスパダと彼のチームは独自に生成型AI動画編集ボードを概念実証として作成することに決定しました。
エスパダは、「これはRunwayによって駆動されていますが、Runwayの製品ではありません。クリストバル・バレンスエラが興味を示し、再共有したものです」と強調しました。
操作方法
1stAveMachineのブルックリンオフィスでのデモでは、1stAI Machineは印象的なプロトタイプとして際立っていました。スリークなマットアルミニウムのシャーシと、ビンテージオーディオ機器を彷彿とさせる扱いやすいコントロールが特徴です。
このマシンには八つのディスプレイが備わっており、一つのフルカラーLCDが最終ビデオ用、六つの小型画面がストーリーボード用、そして操作メッセージ(「再生中」や「生成中」など)を表示するステータスストリップがあります。ユーザーは番号付きのワークフローに従い、1. ストーリー、2. スタイル、3. 音楽、4. オーディオ出力へと進みます。
現在、この装置は「パルプ・フィクション」、「E.T.」、「タイタニック」、「ゴッドファーザー」、「スター・ウォーズ」といった十数のアイコニックな映画のストーリーボードを使用しており、ユーザーはその中から六つを選択して30秒の動画の基礎を形成します。Gen-2 AIによって変換が適用されます。
エスパダは、タイタニックのシーンをユニークな要素を用いて生き生きとしたビジュアルに変換する印象的なデモを披露しました。
音楽とスタイルの選択
このマシンには、ジャンルを超えたAI生成曲を選択できる直感的な音楽セレクターもあります。オーディオは動画のサウンドトラックとして機能し、ジャンル間のハイブリッドな融合をサポートします。レンダリング前に、ユーザーはコントロールノブを使用してスタイルを選択する必要があります。「企業の階段」、「バービーの執着」、「予期せぬ未来」などのスタイルが、最終的な動画の美学に独自の影響を与えます。エスパダは、将来のバージョンではユーザーがカスタムスタイルをアップロードできるようになることを想像しています。
マシン内部にはLinuxを搭載したMac Miniがあり、PythonとOpenFrameworksで開発されたソフトウェアを使用し、動画の転送が容易な無線機能を備えています。
1stAI Machineの今後の展望
現時点では1stAI Machineは独立したプロトタイプですが、AIコミュニティからの関心により、より進化したモデルが登場する可能性があります。将来的には、より軽量なハードウェアを必要とするかもしれません。
エスパダは、未来のバージョンがフェスティバルやコンベンションで使用され、参加者が大画面にAI生成の動画を作成・投影できるシナリオを想像しています。
これらの可能性にもかかわらず、エスパダは独立したハードウェアビジネスを立ち上げることには興味がなく、クライアント向けのストーリーテリングに注力したいと考えています。彼のチームは、AI専用のハードウェアが特定の目的に役立ち、視覚芸術や音楽における専門的なツールのように、ユーザーの創造性を特定の環境で発揮させると信じています。
私の1stAI Machineに対するハンズオン体験を経て、こう言う自信があります:これこそAIハードウェアの理想像だと。