OpenAI sigue mostrando clips de Sora, su avanzado modelo de inteligencia artificial generativa de video fotorealista, que por ahora permanece en uso interno. En el rápidamente cambiante panorama de la inteligencia artificial en video, competidores como Pika están aprovechando este momento.
Recientemente, Pika presentó una nueva función que permite a los usuarios generar automáticamente efectos de sonido para sus videos generados por IA en su plataforma, pika.art. Esta mejora agrega una dimensión crucial a los videos de IA, que a menudo carecen de audio y que anteriormente requerían que los usuarios buscaran archivos de sonido a través de diferentes software de edición. Ahora, los usuarios de Pika pueden generar archivos de sonido directamente en la aplicación, facilitando el proceso creativo.
Esta actualización sigue al lanzamiento de las capacidades de sincronización labial de Pika, que mejoran aún más el contenido generado por IA para creadores individuales y empresas. Con funciones como sincronización labial, efectos de sonido, voces en off y elementos visuales integrados, Pika se posiciona como una plataforma de creación de video generativa todo-en-uno. Esto permite a los usuarios crear proyectos completos sin necesidad de cineastas o diseñadores de sonido independientes.
Las capacidades significativas que ofrece Pika podrían atraer a cineastas, eliminando la necesidad de buscar diferentes recursos. En lugar de explorar bases de datos de contenido, los usuarios pueden simplemente describir su visión y generar rápidamente todos los elementos necesarios directamente desde su imaginación.
Actualmente, la nueva función de efectos de sonido de Pika está disponible solo para miembros de su programa de supercolaboradores o usuarios con una suscripción Pro de $58 al mes. Sin embargo, hay planes para ampliar la disponibilidad más allá de las pruebas beta.
¿Cómo incorporarán los videos de IA de Pika los efectos de sonido?
Pika ha confirmado que los usuarios pueden obtener efectos de sonido de dos maneras principales:
1. Generación Contextual: Los modelos de IA seleccionarán automáticamente el audio que mejor complemente el video generado, basado en el texto proporcionado. Los usuarios solo deben activar el interruptor de "efectos de sonido" al ingresar su solicitud, y el modelo de Pika entrega una salida audiovisual completa en segundos.
2. Enfoque de Seguimiento: Los usuarios pueden agregar sonidos generados por IA después de la creación. Tras generar o cargar un clip sin audio, pueden hacer clic en ‘Editar’ y seleccionar ‘Efectos de sonido’ para describir los sonidos deseados. El modelo generará varias opciones para que los usuarios elijan.
La introducción de audio generado mejorará significativamente el proceso creativo, abordando las ineficiencias anteriores de obtener audio externo. Pika afirma ser la primera plataforma de video IA en integrar audio generado como parte de la salida del video.
Otras empresas también están explorando la generación de sonido. ElevenLabs anunció recientemente inscripciones anticipadas para una función de texto a sonido, mientras que Meta ofrece una tecnología similar llamada AudioGen. Sin embargo, ninguna de estas ofrece un modelo generativo de video integrado como lo hace Pika.
Despliegue Gradual Esperado
La nueva función de efectos de sonido se implementará de manera gradual, comenzando por los participantes del programa de supercolaboradores y los suscriptores Pro de Pika. La retroalimentación de estos primeros usuarios ayudará a refinar la función, permitiendo futuras mejoras accesibles a todos los usuarios de la plataforma.
Desde su lanzamiento en diciembre de 2023, Pika ha fortalecido agresivamente su oferta para competir con actores como Sora de OpenAI. Colaboraciones recientes, como la funcionalidad de sincronización labial desarrollada con ElevenLabs, permiten a los usuarios añadir voces de IA y animaciones sincronizadas a sus videos. Los efectos de sonido añadidos enriquecerán aún más estas experiencias inmersivas.
A medida que Pika evoluciona, tiene como objetivo introducir más funciones, habiendo recaudado $55 millones en financiación con una valoración cercana a los $200 millones. La empresa se está posicionando para desafiar no solo a OpenAI, sino también a otros grandes actores en el espacio de la IA creativa, incluyendo Adobe, Runway, Stability AI y el recientemente lanzado Haiper.