OpenAI расширяет свои горизонты, выходя за рамки компании, известной только благодаря ChatGPT и моделям LLM. Сегодня организация представила Sora, свою инновационную модель генерации видео из текста с использованием ИИ. Соучредитель и генеральный директор Сэм Альтман назвал запуск "замечательным событием" в посте на X (ранее Twitter).
В настоящее время Sora недоступна для широкой публики. Альтман объяснил, что модель проходит стадию "начального тестирования безопасности", направленного на выявление возможных недостатков и неправильного использования. Однако "ограниченное число создателей" уже имеет доступ к модели, и в будущем ожидается более широкий доступ для публики.
Входя в конкурентную среду
Sora вступает в жесткую конкурентную сферу, присоединяясь к стартапам, таким как Runway, Pika и Stability AI, которые уже предлагают решения для генерации видео с помощью ИИ, наряду с крупными игроками, такими как Google с моделью Lumiere.
Отличие Sora заключается в ее впечатляющем качестве. Примерные видео, опубликованные OpenAI, демонстрируют удивительную резкость, плавное движение и точность в изображении человеческой анатомии и физической среды. Особенно стоит отметить, что Sora может генерировать 60-секундные видео за один раз, что превосходит конкурентов, таких как Runway и Pika, которые предлагают только 4 секунды видео за раз.
В рамках увлекательной инициативы Альтман и команда Sora, включая исследователя Уилла Депью, собирают запросы от пользователей в Twitter/X. Они используют эти идеи для демонстрации возможностей Sora в реальном времени, создавая краудсорсинг-доказательство потенциала модели.
Реализм в повседневных моментах
Помимо захватывающих визуальных эффектов, Sora прекрасно справляется с отображением повседневных сцен с поразительным реализмом. Видеоролики, показывающие обычные моменты, такие как виды города из-под виадука или интимные мгновения с женщиной и ее кошкой, подчеркивают способность Sora запечатлеть знакомые человеческие переживания.
Кроме того, исследователь OpenAI Билл Пиблс, занимающийся достижением "искусственного общего интеллекта" (AGI) — ИИ, который превосходит человеческие достижения в экономически ценных задачах, отметил, что Sora значительно поможет в этой задаче, позволяя проводить комплексные симуляции.
Поворотный момент для ИИ
С учетом усиливающегося регулирования ИИ со стороны федеральных агентств США в ответ на опасения по поводу мошенничества и глубоких фейков, внедрение Sora становится значительной вехой не только для OpenAI, но и для всей технологической и медийной отрасли. Влияние Sora на общество, позитивное или негативное, еще предстоит полностью осознать.