Как OpenAI и Meta используют видео на YouTube для обучения ИИ: взгляд на новые тенденции в индустрии

Home Новости ИИ Как OpenAI и Meta используют видео на YouTube для обучения ИИ: взгляд на новые тенденции в индустрии

Updated on апрель 7 2024

С развитием технологий искусственного интеллекта (ИИ) данные становятся ключевым фактором в создании моделей ИИ. Однако недавний отчет Wall Street Journal подчеркивает беспрецедентные сложности, с которыми сталкиваются компании ИИ в получении качественных обучающих данных. Сегодня The New York Times углубляется в стратегии, которые используют эти компании для преодоления этой сложной проблемы, особенно в контексте сложностей, связанных с авторскими правами на ИИ.

OpenAI, лидер в сфере ИИ, имеет особенно острое требование к обучающим данным. По сообщениям, компания транскрибировала более миллиона часов видео с YouTube для разработки своей продвинутой языковой модели GPT-4, используя технологию аудиозаписи Whisper. OpenAI также собрала различные другие ресурсы данных, включая код с GitHub, базы данных шахматных ходов и образовательный контент с Quizlet.

Этот подход вызвал юридические споры. Хотя OpenAI утверждает, что использование данных соответствует принципам добросовестного использования, The Times сообщает, что президент OpenAI Грег Брокман лично участвовал в процессе сбора данных, что дополнительно усложняет вопросы авторского права.

В интервью The Verge представитель OpenAI отметил, что компания разрабатывает уникальные наборы данных для каждой модели, чтобы улучшить понимание мира и поддерживать конкурентные исследования на глобальном уровне. Также упоминается, что OpenAI исследует возможность генерации синтетических данных, чтобы уменьшить зависимость от внешних источников информации.

Google выразила озабоченность по поводу практики OpenAI. Представитель компании сообщает по электронной почте, что Google наблюдает непроверенные сообщения о действиях OpenAI, подчеркивая, что файл robots.txt и условия сервиса Google запрещают неавторизованный парсинг или загрузку контента с YouTube.

Генеральный директор YouTube Нил Мохан в недавнем интервью заявил, что, хотя нет прямых свидетельств использования OpenAI видео с YouTube для обучения модели Sora, такие действия нарушили бы условия сервиса YouTube.

Одновременно Meta сталкивается с собственными проблемами доступности данных. По информации The Times, поскольку команда ИИ Meta стремится догнать OpenAI, она рассматривает сценарии, связанные с несанкционированным использованием защищенных авторским правом произведений. Для расширения своих наборов данных Meta проанализировала огромный массив англоязычных книг, эссе, поэзии и новостных статей, обсуждая возможность выплат за лицензирование книг или прямую покупку у крупных издателей.

Эти события подчеркивают юридические и этические проблемы, с которыми сталкивается индустрия ИИ в сборе и использовании данных. По мере развития технологий возникает неотложный вопрос: как могут развиваться модели ИИ, не нарушая защиту авторских прав? Важно, чтобы компании ИИ и регулирующие органы сотрудничали в установлении более четких и справедливых норм, способствующих здоровому и устойчивому развитию технологий ИИ.

Гиганты Кремниевой долины тратят миллиарды на борьбу за ресурсы для обучения ИИ данных.

ChatGPT Enterprise от OpenAI достиг 300% роста пользователей, превысив 600 000 пользователей всего за три месяца.

Most people like

indieideas.io

11.1K

Откройте для себя инновационные SaaS-решения, вдохновленные ежедневными проблемами пользователей Reddit.

Идеи SaaS AI Business Ideas Generator

SermonAI

41.9K

Повышение пасторской эффективности с помощью ИИ для безуспешной подготовки проповедей.

подготовка к проповеди Religion

Solo - Free AI Website Creator

30.6K

В современном цифровом мире наличие яркого онлайн-присутствия имеет решающее значение для бизнеса любого размера. Создатель веб-сайтов на основе ИИ упрощает процесс создания профессионального сайта, позволяя предпринимателям и компаниям легко разрабатывать впечатляющие ресурсы. Используя передовые технологии, эти инструменты предлагают настраиваемые шаблоны и удобные интерфейсы, давая возможность пользователям установить свою бренд-идентичность и повысить вовлеченность клиентов. Узнайте, как создатель веб-сайтов на базе ИИ может преобразовать вашу бизнес-стратегию и способствовать успеху в интернете.

Создатель веб-сайтов на базе ИИ AI Website Designer

Formshare

14.7K

В современном цифровом мире возможность быстро создавать настроенные формы имеет решающее значение для бизнеса. С помощью современных инструментов ИИ вы можете легко разрабатывать интеллектуальные формы без знаний программирования. Этот удобный подход позволяет всем — от предпринимателей до маркетологов — оптимизировать сбор данных и улучшить пользовательский опыт, экономя время и ресурсы. Узнайте, как создание форм на основе ИИ упрощает вашу работу и повышает качество ваших проектов, делая это доступным для всех, независимо от уровня технических навыков.

Разговорный ИИ No-Code&Low-Code

Find AI tools in YBX