Должно ли так выглядеть оборудование для ИИ?
Этот вопрос не покидает меня с тех пор, как в начале месяца я увидел, как Кристобаль Валенсуэла, CEO стартапа генеративного ИИ в видеопроизводстве Runway ML, опубликовал видео "1stAI Machine" на своем аккаунте в X.
Валенсуэла описал устройство как "первый физический прибор для видеомонтажа, созданный с помощью ИИ", отметив: "Мы ожидаем, что качество видео вскоре сравняется с качеством фотографий. В это время каждый сможет создавать фильмы, не нуждаясь в камере, освещении или актерах; они просто будут взаимодействовать с ИИ. Такой инструмент, как 1stAI Machine, предвосхищает этот момент, исследуя осязаемые интерфейсы, которые расширяют творческие возможности."
В видео демонстрировался угловатый матовый серебристый прибор — так называемая "первая монтажная панель ИИ". С физическими регуляторами и ручками для управления различными стилями ввода, он был значительно больше среднего ноутбука.
Как журналист, освещающий инструменты ИИ в области творчества и медиа, я был заинтригован. Прибавлялся ли Runway, ранее сосредоточенный исключительно на веб-программном обеспечении, к производству оборудования? Если да, то какова ценовая категория, сроки доставки и целевая аудитория?
Возникновение оборудования для ИИ
На прошлой неделе вышло другое устройство оборудования для ИИ, Ai Pin от Humane, с смешанными отзывами, в основном касающимися его цены в $699 и ежемесячной подписки в $24. Этот магнитный значок, разработанный бывшими инженерами Apple, служит помощником в жизни и использует модель GPT-4 от OpenAI, а также попал в список 200 лучших изобретений 2023 года по версии Time Magazine.
Появление оборудования для ИИ очевидно. Так где же находит своё место 1stAI Machine, кто его разработал и что вдохновило на его создание?
Видение за машиной
Валенсуэла отметил "SpecialGuestX для 1stAveMachine" в своем посте. На прошлой неделе я связался с Валенсуэла, SpecialGuestX (SGX) и 1stAveMachine. Мигель Эспада, соучредитель SGX, ответил, сообщив, что их агентство исследует новые нарративы вокруг данных, автоматизации и ИИ.
Эспада подтвердил, что его небольшая команда в Мадриде создала 1stAI Machine. Мы договорились о демонстрации в офисе 1stAveMachine в Бруклине, коллективе креативщиков, работающих с крупными брендами.
Опыт Эспады в области ИИ в художественных проектах обширен: он был одним из первых участников сообщества Disco Diffusion, которое позже стало основой для модели Stable Diffusion. Его агентство ранее адаптировало Stable Diffusion для создания персонализированных видеовизуализаций для клиентов Carvana.
Доступность 1stAI Machine
Не стоит спешить с ожиданием приобретения 1stAI Machine. Эспада уточнил, что это пока единственный в своем роде прототип. "Планов по его продаже нет, но у нас есть план по разработке аппаратного обеспечения", — отметил он.
1stAI Machine возник из клиентского предложения в автомобильной сфере, нацеленное на преобразование раскадровок для нового автомобиля в генеративное видео с использованием программного обеспечения Gen-2 от Runway. Несмотря на то что клиент не стал двигаться дальше с этой идеей, Эспада и его команда решили создать доску для видеомонтажа на основе генеративного ИИ в качестве доказательства концепции, независимо от участия Runway.
Эспада подчеркнул: "Это работает на базе Runway, но это не продукт Runway. Его CEO, Кристобаль Валенсуэла, перепостил его, потому что нашел интересным."
Как это работает
Во время демонстрации в офисе 1stAveMachine в Бруклине 1stAI Machine выглядел как впечатляющий прототип, с элегантным матовым алюминиевым корпусом и удовлетворительными управлениями, напоминающими винтажное аудиооборудование.
Устройство включает восемь дисплеев: один полноцветный LCD для финального видео, шесть меньших экранов для раскадровок и статусная полоса, отображающая сообщения о работе, такие как "воспроизведение" или "генерация". Пользователи следуют нумерованному сценарию: 1. история, 2. стиль, 3. музыка, четвёртая часть отведена для звукового выхода.
В данный момент устройство использует около десятка иконических раскадровок из фильмов, включая "Криминальное чтиво", "E.T.", "Титаник", "Крестный отец" и "Звездные войны". Пользователи могут выбрать шесть раскадровок для создания 30-секундного видео, к которому применяются трансформации от AI Gen-2.
Эспада продемонстрировал поразительный пример, который преобразовал сцену из "Титаника" в яркое изображение с необычными элементами.
Выбор музыки и стиля
Машина также включает интуитивно понятный селектор музыки, позволяющий пользователям выбирать AI-сгенерированные треки в различных жанрах. Звук служит саундтреком к видео, поддерживая гибридное слияние между жанрами.
Перед рендерингом пользователи должны выбрать стиль с помощью регулятора. Стили, такие как "корпоративная лестница", "одержимость Барби" и "непредсказуемое будущее", уникально влияют на финальную эстетику видео. Эспада видит будущие итерации, в которых пользователи смогут загружать собственные стили.
Внутри устройства находится Mac Mini под управлением Linux с программным обеспечением, разработанным на Python и OpenFrameworks, с беспроводными возможностями для легкого переноса видео.
Будущие перспективы для 1stAI Machine
Хотя текущая версия 1stAI Machine является самостоятельным прототипом, интерес со стороны сообщества ИИ предполагает, что может появиться более продвинутая модель, требующая менее мощного оборудования.
Эспада представляет сценарии, в которых будущая версия могла бы использоваться на фестивалях или конвенциях, позволяя участникам создавать и проектировать видео, сгенерированные ИИ, на больших экранах.
Несмотря на эти возможности, Эспада не заинтересован в запуске самостоятельного бизнеса по выпуску аппаратного обеспечения. Он предпочитает сосредоточиться на повествовании для клиентов.
Команда считает, что специализированное оборудование для ИИ служит конкретным целям, направляя креативность пользователей в сосредоточенной среде, подобно тому, как профессионалы используют специализированные инструменты в визуальных искусствах и музыке.
После моего практического опыта с 1stAI Machine, я могу уверенно утверждать: похоже, именно так должно выглядеть оборудование для ИИ.