OpenAI präsentiert weiterhin Clips von Sora, seinem fortschrittlichen, fotorealistischen generativen KI-Video-Modell, das vorerst nur intern genutzt wird. In der sich schnell entwickelnden Landschaft der Video-KI nutzen Wettbewerber wie Pika diesen Moment optimal aus.
Kürzlich hat Pika eine neue Funktion eingeführt, mit der Nutzer automatisch Soundeffekte für ihre KI-generierten Videos auf der Plattform pika.art erzeugen können. Dieses Upgrade fügt eine entscheidende Dimension hinzu, da KI-Videos oft an Audio fehlen und Benutzer bisher Sounddateien über verschiedene Schnittsoftware beschaffen mussten. Jetzt können Pika-Nutzer Sounddateien direkt in der App erzeugen und so den kreativen Prozess vereinfachen.
Dieses Update folgt der Einführung von PikAs Sprachausgabe-Funktionen, die den Inhalt für Einzelkreatoren und Unternehmen weiter verbessern. Mit integrierten Funktionen wie Lippen-Synchronisation, Soundeffekten, Voiceovers und visuellen Effekten positioniert sich Pika als eine umfassende Plattform zur Erstellung generativer KI-Videos. Dadurch können Nutzer gesamte Projekte erstellen, ohne separate Kameraleute oder Tontechniker zu benötigen.
Die leistungsstarken Funktionen von Pika dürften Filmemacher ansprechen, da sie die Notwendigkeit reduzieren, verschiedene Assets zu beschaffen. Anstatt durch Stockdatenbanken zu suchen, können Nutzer einfach ihre Vision beschreiben und alle notwendigen Elemente direkt aus ihrer Vorstellung generieren.
Derzeit ist die neue Soundeffekt-Funktion nur für Mitglieder des Super-Kollaboratoren-Programms oder Pro-Nutzer mit einem Abonnement von 58 Dollar pro Monat verfügbar. Geplant ist jedoch, die Verfügbarkeit über die Beta-Testphase hinaus zu erweitern.
Wie werden PikAs KI-Videos Soundeffekte integrieren? Pika hat bestätigt, dass Nutzer Soundeffekte auf zwei Hauptarten erhalten können:
1. Kontexterzeugung: Die KI-Modelle wählen automatisch den Audio-Inhalt, der am besten zum generierten Video passt, basierend auf dem Text-Prompt. Nutzer aktivieren einfach den „Soundeffekte“-Schalter beim Eingeben ihres Prompts, und PikAs Modell liefert binnen Sekunden eine vollständige audiovisuelle Ausgabe.
2. Nachträgliche Anpassung: Nutzer können nach der Erstellung KI-generierte Sounds hinzufügen. Nachdem sie ein audiofreies Clip generiert oder hochgeladen haben, klicken sie auf „Bearbeiten“ und wählen „Soundeffekte“, um die gewünschten Klänge zu beschreiben. Das Modell generiert dann mehrere Optionen zur Auswahl.
Die Einführung generierter Audioinhalte wird den kreativen Prozess erheblich verbessern, da sie die vorherigen Ineffizienzen beim Beschaffen externer Audioquellen angeht. Pika beansprucht, die erste KI-Video-Plattform zu sein, die generierten Audio-Content als Teil der Videoausgabe integriert.
Andere Unternehmen erkunden ebenfalls die Klanggenerierung; so hat ElevenLabs kürzlich eine frühe Anmeldung für eine Text-zu-Sound-KI-Funktion angekündigt, während Meta eine ähnliche Technologie namens AudioGen bietet. Allerdings bietet keines dieser Unternehmen ein integriertes generatives KI-Video-Modell wie Pika.
Erwarteter schrittweiser Rollout
Die neue Soundeffekt-Funktion wird schrittweise eingeführt, beginnend mit den Nutzern im Super-Kollaboratoren-Programm oder den Pro-Abonnenten von Pika. Das Feedback dieser frühen Nutzer wird helfen, die Funktion zu verfeinern und zukünftig für alle Plattformnutzer zugänglich zu machen.
Seit dem Start im Dezember 2023 hat Pika seine Angebote aggressiv ausgebaut, um mit Wettbewerbern wie OpenAIs bevorstehendem Sora zu konkurrieren. Kürzliche Kooperationen, wie die Entwicklung der Lippen-Synchronisation mit ElevenLabs, ermöglichen es Nutzern, KI-Stimmen und synchronisierte Animationen in ihre Videos einzufügen. Die zusätzlichen Soundeffekte werden diese immersiven Erfahrungen weiter bereichern.
Während sich Pika weiterentwickelt, plant das Unternehmen, weitere Funktionen einzuführen, nachdem es 55 Millionen Dollar an Finanzierung bei einer Bewertung von fast 200 Millionen Dollar erzielt hat. Pika positioniert sich, um nicht nur OpenAI, sondern auch andere große Akteure im Bereich kreative KI, wie Adobe, Runway, Stability AI und das neu gestartete Haiper, herauszufordern.