Растущее влияние эффективного альтруизма на безопасность искусственного интеллекта

Home Новости ИИ Растущее влияние эффективного альтруизма на безопасность искусственного интеллекта

Updated on октябрь 31 2024

Недавно американский эксперт в области ИИ-политики отметил: «Если вы не исследуете влияние эффективного альтруизма (EA), вы упускаете важную часть истории». Размышляя об этом, я осознал, что в своем последнем материале недооценил этот аспект.

Ирония в том, что я считал свою статью о рисках безопасности больших языковых моделей (LLM) простой победой. Недавний указ президента США по ИИ требует от компаний, разрабатывающих основополагающие модели, документировать права собственности и меры безопасности для моделей двойного назначения, что делает эту тему актуальной. В своей статье я провел интервью с Джейсоном Клинтоном, директором по информационной безопасности компании Anthropic, который подчеркнул необходимость защиты весов модели Claude, LLM компании. Он отметил опасность доступа преступников, террористов и государств к данным сложным моделям, указав, что «если атакующий получит доступ ко всему файлу, он сможет контролировать всю нейронную сеть». Другие ведущие компании также разделяют эту озабоченность; новый «Рамочный документ о готовности» от OpenAI касается необходимости ограничения доступа к конфиденциальной информации моделей.

Я также общался с Селлой Нево и Дэном Лахавом из RAND Corporation, авторами важного отчета «Защита весов моделей искусственного интеллекта». Нево, возглавляющий Центр Мезельсона RAND, предупредил о возможных серьезных последствиях для национальной безопасности в результате использования ИИ моделей для разработки биологического оружия.

Связи эффективного альтруизма в безопасности ИИ

С оглядкой, я понял, что моя статья не отразила сложные связи между сообществом эффективного альтруизма и развивающемся направлении безопасности ИИ. Этот упущенный момент особенно заметен на фоне растущего влияния EA, интеллектуального движения, подчеркивающего использование разума и доказательств для блага человечества, в частности в предотвращении экзистенциальных рисков от продвинутого ИИ. Критики утверждают, что акцент EA на далеких угрозах отвлекает от не менее актуальных проблем, таких как предвзятость, дезинформация и кибербезопасность в разработке ИИ.

Недавно EA оказалась в центре внимания из-за увольнения генерального директора OpenAI Сэма Альтмана, что подчеркнуло связи EA в процессе принятия высокорисковых решений. Несмотря на то, что я знал о связях Anthropic с EA — основатель FTX Сэм Банкман-Фрид когда-то владел долей в стартапе на сумму 500 миллионов долларов — я не углубился в их влияние на мой рассказ. Однако, прочитав статью в Politico, которая, как назло, вышла на следующий день, я обнаружил ключевые связи между RAND и EA, включая значительное финансирование.

Статья в Politico показала, что исследователи RAND сыграли важную роль в формировании указа президента по весам моделей, и организация получила более 15 миллионов долларов от Open Philanthropy — инициативы EA, поддерживаемой соучредителем Facebook Дастином Москвитцем. Примечательно, что генеральный директор RAND Джейсон Мэтини и старший ученый Джефф Алстотт являются признанными эффективными альтруистами с предыдущими связями с администрацией Байдена.

Взгляды сообщества эффективного альтруизма

В ходе нашего дальнейшего разговора Нево отметил, что мощное присутствие сторонников EA в сфере безопасности ИИ не должно удивлять. Исторически EA находилась на переднем крае обсуждений о безопасности ИИ, поэтому любой, кто встречается с этой областью, вероятно, сталкивался с взглядами EA.

Нево также выразил недовольство тоном статьи в Politico, отметив, что она нечестно намекала на неправильные действия, игнорируя длительную роль RAND в предоставлении ценных исследований для законодателей. Он подчеркнул, что ни он, ни его центр не были вовлечены в указ, и положения о безопасности моделей были заранее установленными добровольными обязательствами со стороны Белого дома.

Хотя Центр Мезельсона остается относительно неизвестным, Нево отметил, что он является одним из множества исследовательских центров RAND, фокусирующихся на биомониторинге и пересечении ИИ с биологической безопасностью.

Значение эффективного альтруизма в безопасности ИИ

Действительно ли имеет значение влияние EA? Размышляя о знаменитой фразе Джека Николсона: «Ты нуждаешься во мне на этой стене!», возникает вопрос: если нам нужны преданные своему делу люди в сфере безопасности ИИ, имеет ли значение их идеология?

Для многих, выступающих за прозрачность и эффективную политику в области ИИ, ответ положительный. Как подчеркивается в отчетах Politico о влиянии EA на Вашингтон, эти связи будут значительно формировать будущие политики, регуляции и развитие ИИ.

Американский эксперт по ИИ-политике, с которым я разговаривал, заметил, что многие в области политики упускают из виду потенциальные идеологические повестки в сфере ИИ. К сожалению, они недооценивают их влияние.

Patronus AI выявляет "вызывающие беспокойство" уязвимости безопасности в основных системах искусственного интеллекта.

Ludo.ai запускает инновационный инструмент генерации видео из текста для разработчиков игр

Most people like

Noctie.ai

52.6K

Мгновенная шахматная экспертиза, куда бы вы ни пошли.

Шахматный репетитор Game

AI Color Palette Generator

198.6K

Раскройте свой творческий потенциал, создавая потрясающие цветовые палитры, которые придают жизнь вашим дизайнам. Попробуйте эти палитры на реальных проектах, чтобы увидеть, как они улучшают эстетику и воздействие. Независимо от того, являетесь ли вы дизайнером или любителем DIY, овладение цветовыми сочетаниями поднимет вашу работу на новый уровень.

инструмент для работы с цветом AI Colorize

v0.dev

Представляем ИИ-управляемую Генеративную UI Систему, предназначенную для революции пользовательского опыта. Эта инновационная технология использует мощь искусственного интеллекта для создания динамических и отзывчивых пользовательских интерфейсов, адаптирующихся к индивидуальным потребностям и предпочтениям. Узнайте, как наш генеративный подход улучшает эффективность дизайна и повышает качество взаимодействия.

генеративный пользовательский интерфейс AI Code Generator

AIFreeBox

700.4K

Откройте для себя идеальный хаб инструментов ИИ, созданный специально для креативных начинаний. Исследуйте разнообразные инновационные инструменты, которые помогут вам улучшить ваши художественные проекты, оптимизировать рабочий процесс и раскрыть творческий потенциал. Независимо от того, являетесь ли вы дизайнером, писателем или создателем контента, наша платформа предлагает все необходимое для повышения качества вашей работы и вдохновения вашей фантазии.

AI писатель AI Tools Directory

Find AI tools in YBX