Como Deve Ser o Hardware de IA?
Essa é a pergunta que me ocorre desde o início deste mês, quando vi Cristóbal Valenzuela, CEO da startup de vídeo gerado por IA Runway ML, postar um vídeo da "1stAI Machine" em sua conta do X. Valenzuela a descreveu como "o primeiro dispositivo físico para edição de vídeo gerado por IA", afirmando: "Esperamos que a qualidade dos vídeos logo se iguale à das fotos. Nesse momento, qualquer pessoa poderá criar filmes sem precisar de câmera, luzes ou atores; elas apenas interagirão com as IAs. Uma ferramenta como a 1stAI Machine antecipa esse momento ao explorar interfaces tangíveis que ampliam a criatividade."
O vídeo mostrava um dispositivo prateado, de ângulos marcantes, o chamado "primeiro painel de edição de IA". Com botões e dials físicos para controlar diversos estilos de entrada, era visivelmente maior que um laptop comum. Como jornalista cobrindo ferramentas de IA na criatividade e produção de mídia, fiquei intrigado. A Runway, que anteriormente se concentrava apenas em software baseado na web, estaria entrando no mercado de hardware? Se sim, qual seria o preço, o prazo de envio e o público-alvo pretendido?
O Surgimento do Hardware de IA
Na semana passada, outro dispositivo de hardware de IA, o Ai Pin da Humane, foi lançado com críticas mistas, principalmente por conta de seu preço de $699 e uma assinatura mensal de $24. Este pin magnético, projetado por ex-engenheiros da Apple, funciona como um assistente pessoal, alimentado pelo modelo GPT-4 da OpenAI, e até fez parte da lista das 200 Melhores Invenções de 2023 da revista Time. A realidade do hardware de IA é inegável. Então, onde se encaixa a 1stAI Machine, quem a desenvolveu e o que inspirou sua criação?
A Visão por Trás da Máquina
Valenzuela creditou "SpecialGuestX por 1stAveMachine" em sua postagem. Entrevistei Valenzuela, a SpecialGuestX (SGX) e a 1stAveMachine na semana passada. Miguel Espada, co-fundador da SGX, respondeu, afirmando que sua agência explora novas narrativas sobre dados, automação e IA. Espada confirmou que sua pequena equipe em Madri criou a 1stAI Machine. Organizamos uma demonstração prática nos escritórios da 1stAveMachine, um coletivo de criativos que trabalham com grandes marcas.
A experiência de Espada com IA em empreendimentos artísticos é vasta; ele foi um dos primeiros membros da comunidade Disco Diffusion, que depois evoluiu para o modelo de IA Stable Diffusion. Sua agência adaptou anteriormente o Stable Diffusion para gerar vinhetas de vídeo personalizadas para os clientes da Carvana.
Disponibilidade da 1stAI Machine
Não fique animado para adquirir uma 1stAI Machine ainda. Espada esclareceu que atualmente se trata de um protótipo exclusivo. "Não há planos para vendê-la, mas temos produtos de hardware no nosso cronograma", observou. A 1stAI Machine surgiu de uma proposta feita a um cliente do setor automotivo, visando converter storyboards de um novo modelo de carro em vídeo gerado usando o software Gen-2 da Runway. Embora o cliente não tenha dado seguimento à ideia, Espada e sua equipe decidiram construir um painel de edição de vídeo gerado por IA como prova de conceito, sem a participação da Runway. Espada enfatizou: "É alimentada pela Runway, mas não é um produto da Runway. Seu CEO, Cristóbal Valenzuela, compartilhou novamente porque achou interessante."
Como Funciona
Durante a demonstração no escritório da 1stAveMachine, a 1stAI Machine impressionou como um protótipo notável, exibindo um chassi de alumínio matte elegante e controles satisfatórios que lembram equipamentos de áudio vintage. A máquina conta com oito telas: uma LCD colorida para o vídeo final, seis telas menores para storyboards, e uma faixa de status exibindo mensagens de operação como "executando" ou "gerando". Os usuários seguem um fluxo de trabalho numerado: 1. História, 2. Estilo, 3. Música, sendo a quarta seção reservada para saída de áudio.
Atualmente, o dispositivo utiliza cerca de uma dúzia de storyboards icônicos de filmes, incluindo Pulp Fiction, E.T., Titanic, O Poderoso Chefão e Star Wars. Os usuários podem selecionar seis storyboards para formar a base de um vídeo de 30 segundos, com transformações aplicadas pela IA Gen-2. Espada apresentou uma demonstracão impressionante que transformou uma cena de Titanic em uma visualização vibrante com elementos não convencionais.
Seleção de Música e Estilo
A máquina também conta com um seletor de música intuitivo, permitindo que os usuários escolham faixas geradas por IA de diferentes gêneros. O áudio serve como trilha sonora do vídeo, apoiando uma fusão híbrida entre estilos. Antes da renderização, os usuários devem escolher um estilo usando um botão de controle. Estilos como "escada corporativa", "obsessão barbie" e "futuro inesperado" contribuem de forma única para a estética final do vídeo. Espada imagina iterações futuras em que os usuários poderão fazer upload de estilos personalizados.
Dentro da máquina, há um Mac Mini executando Linux, com software desenvolvido em Python e OpenFrameworks, apresentando capacidades sem fio para fácil transferência de vídeo.
Perspectivas Futuras para a 1stAI Machine
Embora a 1stAI Machine atual seja um protótipo autônomo, o interesse da comunidade de IA sugere que um modelo mais avançado poderá surgir, potencialmente exigindo hardware menos poderoso. Espada imagina cenários em que uma futura versão poderia ser utilizada em festivais ou convenções, permitindo que participantes criem e projetem vídeos gerados por IA em exibições maiores.
Apesar dessas possibilidades, Espada não está interessado em lançar um negócio de hardware independente. Ele prefere se concentrar na narrativa para clientes. A equipe acredita que hardware dedicado para IA serve a propósitos específicos, canalizando a criatividade do usuário em um ambiente focado, semelhante a como profissionais usam ferramentas especializadas nas artes visuais e na música.
Após minha experiência prática com a 1stAI Machine, posso afirmar com confiança: é assim que o hardware de IA deve se parecer.