Ist das das Aussehen von KI-Hardware, das wir erwarten sollten?
Diese Frage beschäftigt mich seit Anfang des Monats, als ich Cristóbal Valenzuela, den CEO des generativen KI-Video-Startups Runway ML, sah, wie er ein Video der „1stAI Machine“ auf seinem X-Konto postete. Valenzuela bezeichnete es als „das erste physische Gerät zum Videoschnitt, das von KI generiert wurde“ und erklärte: „Wir gehen davon aus, dass die Qualität von Videos bald der von Fotos entsprechen wird. Zu diesem Zeitpunkt wird jeder Filme erstellen können, ohne eine Kamera, Licht oder Schauspieler zu benötigen; man wird einfach mit den KIs interagieren. Ein Werkzeug wie die 1stAI Machine antizipiert diesen Moment, indem es greifbare Schnittstellen erkundet, die Kreativität fördern.“
Im Video war ein kantiges, matt-silbernes Gerät zu sehen – das sogenannte „erste KI-Bearbeitungsboard“. Mit physischen Reglern zur Steuerung verschiedener Eingabestile war es deutlich größer als ein durchschnittlicher Laptop.
Als Journalist, der KI-Tools in Kreativität und Medienproduktion abdeckt, war ich begeistert. Wagten sich Runway, die zuvor ausschließlich auf webbasierte Software fokussiert waren, in den Hardware-Bereich? Wenn ja, wie hoch war der Preis, der Versandzeitraum und die Zielgruppe?
Die Entstehung von KI-Hardware
Letzte Woche wurde ein weiteres KI-Hardware-Gerät, der Ai Pin von Humane, mit gemischten Kritiken eingeführt, meist wegen seines Preises von 699 $ und einem monatlichen Abonnement von 24 $. Dieser magnetische Pin, designt von ehemaligen Apple-Ingenieuren, fungiert als Lebensassistent, der von OpenAIs GPT-4-Modell betrieben wird, und schaffte es sogar auf die Liste der 200 besten Erfindungen 2023 von Time Magazine.
Die Entstehung von KI-Hardware ist offensichtlich. Wo passt also die 1stAI Machine hinein, wer hat sie entwickelt und was hat zu ihrer Schaffung inspiriert?
Die Vision hinter der Maschine
Valenzuela erwähnte „SpecialGuestX für 1stAveMachine“ in seinem Beitrag. Ich kontaktierte Valenzuela, SpecialGuestX (SGX) und 1stAveMachine letzte Woche. Miguel Espada, Mitbegründer von SGX, antwortete und erklärte, dass ihre Agentur neue Narrative rund um Daten, Automatisierung und KI erkundet.
Espada bestätigte, dass sein kleines Team in Madrid die 1stAI Machine entwickelt hat. Wir vereinbarten eine praktische Demo im Büro von 1stAveMachine in Brooklyn, einem Kollektiv von Kreativen, das mit großen Marken arbeitet.
Espadas Erfahrungen mit KI in künstlerischen Projekten sind umfangreich; er war ein frühes Mitglied der Disco Diffusion-Gemeinschaft, die später in das Stable Diffusion KI-Modell überging. Seine Agentur hat zuvor Stable Diffusion angepasst, um personalisierte KI-Video-Vignetten für die Kunden von Carvana zu generieren.
Verfügbarkeit der 1stAI Machine
Freuen Sie sich noch nicht darauf, eine 1stAI Machine zu erwerben. Espada stellte klar, dass es sich derzeit um einen einzigartigen Prototyp handelt. „Es gibt keine Pläne, es zu verkaufen, aber wir haben Hardwareprodukte in der Pipeline“, bemerkte er.
Die 1stAI Machine entstand aus einem Kundenpitch im Automobilsektor, der darauf abzielte, Storyboards für ein neues Automodell mithilfe von Runways Gen-2-Software in generatives Video umzuwandeln. Obwohl der Kunde die Idee nicht weiterverfolgte, beschlossen Espada und sein Team, ein generatives KI-Videoschnitt-Board als Machbarkeitsstudie zu entwickeln, unabhängig von Runways Beteiligung.
Espada betonte: „Es wird von Runway unterstützt, ist aber kein Produkt von Runway. Sein CEO, Cristóbal Valenzuela, hat es erneut geteilt, weil er es interessant fand.“
Funktionsweise
Während der Demo im Büro von 1stAveMachine in Brooklyn fiel die 1stAI Machine als beeindruckender Prototyp auf, mit einem eleganten, matten Aluminiumgehäuse und angenehm zu bedienenden Kontrollen, die an Vintage-Audio-Geräte erinnern.
Die Maschine verfügt über acht Displays: ein vollfarbiges LCD für das finale Video, sechs kleinere Bildschirme für Storyboards und einen Statusstreifen, der Betriebsnachrichten wie „wird abgespielt“ oder „generiert“ anzeigt. Die Nutzer folgen einem nummerierten Workflow: 1. Story, 2. Stil, 3. Musik, wobei der vierte Abschnitt für die Audioausgabe reserviert ist.
Aktuell nutzt das Gerät etwa ein Dutzend ikonischer Film-Storyboards, darunter Pulp Fiction, E.T., Titanic, Der Pate und Star Wars. Nutzer können sechs Storyboards auswählen, um die Grundlage für ein 30-sekündiges Video zu bilden, wobei Transformationen durch die Gen-2-KI angewendet werden.
Espada präsentierte eine eindrucksvolle Demo, die eine Szene aus Titanic in eine lebendige Visualisierung mit unkonventionellen Elementen verwandelte.
Musik- und Stilwahl
Die Maschine bietet auch einen intuitiven Musiksektor, der es den Nutzern ermöglicht, KI-generierte Tracks in verschiedenen Genres auszuwählen. Der Ton trägt zur musikalischen Untermalung des Videos bei und unterstützt eine hybride Fusion zwischen den Genres.
Vor der Erstellung müssen die Nutzer einen Stil über einen Regler auswählen. Stile wie „Karriereleiter“, „Barbie-Besessenheit“ und „unerwartete Zukunft“ tragen auf einzigartige Weise zur finalen Videoästhetik bei. Espada visiert zukünftige Versionen an, bei denen Nutzer benutzerdefinierte Stile hochladen können.
Im Inneren der Maschine läuft ein Mac Mini mit Linux, die Software wurde in Python und OpenFrameworks entwickelt und verfügt über drahtlose Funktionen für einen einfachen Video-Transfer.
Zukunftsaussichten für die 1stAI Machine
Während die aktuelle 1stAI Machine ein eigenständiger Prototyp ist, deutet das Interesse der KI-Community darauf hin, dass ein weiter entwickeltes Modell erscheinen könnte, das möglicherweise weniger leistungsstarke Hardware benötigt.
Espada stellt sich Szenarien vor, in denen eine zukünftige Version auf Festivals oder Konferenzen verwendet werden könnte, sodass die Teilnehmer KI-generierte Videos auf größeren Displays erstellen und projizieren können.
Trotz dieser Möglichkeiten hat Espada nicht vor, ein eigenständiges Hardwaregeschäft zu starten. Er möchte sich lieber auf das Storytelling für Kunden konzentrieren.
Das Team ist der Meinung, dass spezialisierte Hardware für KI spezifische Zwecke erfüllt und die Kreativität der Nutzer in einer fokussierten Umgebung kanalisiert, ähnlich wie Profis spezialisierte Werkzeuge in visuellen Künsten und Musik verwenden.
Nach meiner praktischen Erfahrung mit der 1stAI Machine kann ich mit Sicherheit sagen: So sollte KI-Hardware aussehen.