Эксклюзивное интервью с ведущим джейлбрейкером ChatGPT и экспертом по другим крупным языковым моделям (LLM)

В понедельник, 13 мая 2024 года, в 10:30 по тихоокеанскому времени OpenAI представила свою новейшую модель искусственного интеллекта, GPT-4o, продемонстрировав её впечатляющую способность вести естественные беседы с помощью аудио-команд. Эта мультимодальная система также эффективно обрабатывает загруженные аудио-, видео- и текстовые файлы, обеспечивая более быстрые ответы по более низкой цене по сравнению с предыдущими версиями.

Всего через несколько часов, в 14:29 по тихоокеанскому времени, модель была незаконно использована индивидуумом, известным как «Pliny the Prompter», который поделился конкретной командой в социальной сети X, которая обошла ограничения безопасности модели. Это «взлом» позволил пользователям генерировать откровенный контент или анализировать чувствительные материалы, такие как рентгеновские снимки — функции, которые ранее были ограничены.

Pliny the Prompter не новичок в этой сфере. С прошлого года он взламывает популярные крупные языковые модели (LLMs), такие как Claude от Anthropic и Gemini от Google, создавая различные противоречивые результаты — от запрещённых инструкций до несанкционированных визуальных изображений знаменитостей.

В мае 2023 года Pliny основал сообщество в Discord под названием «BASI PROMPT1NG», чтобы объединить единомышленников-энтузиастов взлома, содействуя сотрудничеству в преодолении границ, установленных провайдерами ИИ.

Современный ландшафт взлома LLM в 2024 году отражает прошедшие тенденции в iOS, когда пользователи быстро находили способы настроить строго контролируемое ПО Apple. Однако в случае с LLM взломщики могут получить доступ к ещё более продвинутым и автономным системам.

Но что движет этими взломщиками? Являются ли они просто агентами хаоса или у них есть более глубокие намерения? Мы провели эксклюзивное интервью с Pliny, чтобы исследовать его мотивацию и взгляды на ИИ:

медиа: Когда вы начали взламывать LLM? Занимались ли вы чем-то подобным раньше?

Pliny the Prompter: Я занимаюсь этим около 9 месяцев; ранее ничего подобного не делал.

Каковы ваши сильнейшие навыки в этой области?

Pliny the Prompter: Взлом, инъекции команд и утечки системных команд. Это требует креативности, распознавания паттернов и постоянной практики, а также междисциплинарных знаний и интуиции.

Почему вы взламываете LLM? Какое влияние вы надеетесь оказать на пользователей и технологическую индустрию?

Pliny the Prompter: Мне не нравятся ограничения; когда мне говорят, что я не могу что-то сделать, это подстёгивает мою настойчивость. Я вижу разблокировку ИИ не только как личную победу, но и как способ показать ограничения защитных мер. Моя цель — повысить осведомлённость о истинном потенциале ИИ и поощрять прозрачность.

Как вы находите недостатки в новых моделях?

Pliny the Prompter: Я анализирую, как мыслит система, допускает ли она ролевые игры, её творческие возможности и взаимодействие с различными типами текста.

Обращались ли к вам провайдеры ИИ по поводу вашей работы?

Pliny the Prompter: Да, они выражали восхищение моими способностями.

Беспокоит ли вас возможность юридических последствий за взлом?

Pliny the Prompter: Всегда существует определённая обеспокоенность, но законы о взломе ИИ всё ещё неясны. Меня ни разу не банили, хотя предупреждения я получал. Большинство организаций понимают, что эта форма тестирования в конечном итоге защищает их интересы.

Как вы отвечаете критикам, которые считают взлом опасным?

Pliny the Prompter: Хотя это может показаться рискованным, ответственное тестирование критически важно для выявления и предотвращения опасных уязвимостей в ИИ. Этические вопросы, касающиеся дипфейков, также вызывают важные обсуждения о подотчётности в контенте, сгенерированном ИИ.

Что вдохновило вас на имя «Pliny the Prompter»?

Pliny the Prompter: Я черпаю вдохновение у Плиния Старшего, исторической фигуры, известной своими разными талантами и храбростью. Его дух исследователя перекликается с моей собственный любопытством и настойчивостью.

В эпоху стремительно развивающихся технологий ИИ действия таких взломщиков, как Pliny the Prompter, поднимают значительные вопросы об этике использования ИИ, границах творчества и продолжающемся диалоге о будущем искусственного интеллекта.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles