Скандал вокруг бесплатного набора изображений ИИ после удаления материалов с детской сексуальной эксплуатацией

Home Новости ИИ Скандал вокруг бесплатного набора изображений ИИ после удаления материалов с детской сексуальной эксплуатацией

Updated on декабрь 19 2023

Недавний отчет Стэнфордской интернет-обсерватории выявил, что набор данных LAION-5B, значимый источник открытых данных для искусственного интеллекта, используемый для обучения популярных генераторов изображений, таких как Stable Diffusion 1.5 и Imagen от Google, содержит как минимум 1,008 случаев материалов сексуального насилия над детьми (CSAM), при этом подозревается множество других. Выпущенный в марте 2022 года, этот обширный набор данных включает более 5 миллиардов изображений и сопутствующих подписей, собранных из интернета. Отчет вызывает опасения о том, что присутствие CSAM в наборе данных может привести к созданию новыми AI-системами реалистичных изображений насилия над детьми.

В ответ на это LAION объявила 404 Media, что временно удаляет свои наборы данных «из-за чрезмерной осторожности», чтобы обеспечить безопасность материалов перед их повторной публикацией.

Наборы данных LAION уже подвергались критике. В октябре 2021 года когнитивный ученый Абеба Бирхане опубликовала статью, в которой проанализировала LAION-400M, более ранний набор данных. Ее результаты подчеркивают наличие проблемного контента, включая откровенные изображения и тексты, связанные с изнасилованием и порно.

В сентябре 2022 года художница Лапин обнаружила свои частные медицинские фотографии, сделанные ее врачом в 2013 году, в наборе данных LAION-5B, используя сайт Have I Been Trained, который помогает пользователям находить свои работы в наборах данных для обучения AI.

Групповой иск Andersen et al. против Stability AI LTD и других, поданный в январе 2023 года, включал LAION в список обвинений против Stability AI, Midjourney и DeviantArt. Истцы утверждали, что Stability AI незаконно скачала миллиарды защищенных авторским правом изображений, при этом LAION якобы предоставила собранные данные для создания Stable Diffusion.

Победительница наград, художница Карла Ортис, работавшая с ведущими компаниями, такими как Industrial Light & Magic и Marvel Studios, выступила на панели FTC в октябре с озабоченностью относительно набора данных LAION-5B. Она отметила: «LAION-5B содержит 5,8 миллиарда пар текста и изображений, которые включают мои работы и работы почти всех, кого я знаю. Кроме интеллектуальной собственности, это также содержит глубоко проблематичные материалы, такие как частные медицинские записи, несанкционированная порнография и изображения детей».

Эндрю Нг, видная фигура в области ИИ и former руководитель Google Brain, выразил обеспокоенность по поводу потенциальных последствий ограничения доступа к таким наборам данных, как LAION. В своем информационном бюллетене DeepLearning.ai он подчеркнул, что успех недавних достижений в области машинного обучения зависел от доступа к обширным, свободно доступным данным. Нг считает, что ограничение доступа к критически важным наборам данных сможет затормозить прогресс в таких сферах, как искусство, образование и разработка лекарств, призывая сообщество ИИ повысить прозрачность в сборе и использовании данных.

LAION, что расшифровывается как Large-scale AI Open Network, был соучреждён Кристофом Шумманом, который был вдохновлен общением с энтузиастами ИИ в Discord. Он стремился создать открытый набор данных для обучения моделей «изображение-текст». За несколько недель LAION собрал 3 миллиона пар изображений и текстов, в конечном итоге увеличив объем до более чем 5 миллиардов.

LAION также участвует в обсуждениях об открытом ИИ, выступая за ускорение исследований и создание совместного международного вычислительного кластера для крупных моделей ИИ. Примечательно, что LAION собирал визуальные данные с онлайн-платформ для покупок, таких как Shopify, eBay и Amazon, которые исследователи Института ИИ Оллена недавно изучили в исследовании LAION-2B-en, подмножества LAION-5B. Они обнаружили, что примерно 6% документов из набора данных происходят из Shopify, что подчеркивает необходимость дальнейшего расследования источников изображений, используемых для обучения моделей ИИ.

Fable запускает открытый AI-инструмент, который революционизирует будущие симуляции Westworld

Представляем нового эксперта по безопасности SaaS от AppOmni, работающего на базе искусственного интеллекта: использование генеративных технологий для повышения уровня защиты.

Most people like

Zebracat

283.1K

В современном цифровом мире эффективный маркетинг требует ярких визуалов, которые находят отклик у аудитории. Создание видео с использованием ИИ упрощает процесс производства качественного контента, что позволяет брендам более эффективно взаимодействовать с зрителями. Используя сложные алгоритмы и машинное обучение, компании теперь могут создавать индивидуальные видео, которые не только привлекают внимание, но и способствуют конверсиям. Узнайте, как технологии ИИ трансформируют видеомаркетинг в динамичный инструмент для роста бренда и связи с аудиторией.

Создатель видео с ИИ AI Video Generator

Up Learn

1.4M

Раскрытие секретов достижения результатов A* на экзаменах A Level стало более доступным, благодаря мощному пересечению ИИ и когнитивной науки. Эти передовые области предлагают инновационные стратегии и инструменты, которые улучшают обучение и запоминание, открывая путь к академическому успеху. Используя их идеи, студенты могут максимально раскрыть свой потенциал и преуспеть в учебе.

ИИ AI Course

AI Web Designer

27.6K

В современном цифровом пространстве поддержание актуальности и привлекательности вашего веб-сайта критически важно для привлечения и удержания посетителей. Наш инструмент редизайна веб-сайтов на основе ИИ использует передовые алгоритмы для анализа поведения пользователей и тенденций дизайна, обеспечивая бесшовный и динамичный онлайн-опыт. Это инновационное решение позволяет компаниям без усилий улучшать свое веб-присутствие, повышать вовлеченность пользователей и, в конечном итоге, увеличивать конверсии. Узнайте, как наши технологии ИИ могут преобразовать ваш веб-сайт в мощный инструмент для роста.

Редизайн веб-сайта ИИ AI Website Designer

ChordChord

194.4K

Представляем ChordChord: ваш идеальный генератор аккордов и инструмент для создания музыки! Независимо от того, являетесь ли вы опытным музыкантом или только начинаете, ChordChord упрощает создание прекрасных мелодий и исследование бесконечных музыкальных возможностей.

аккордовая прогрессия AI Music Generator

Find AI tools in YBX