Для эффективного масштабирования крупных языковых моделей (LLM) в рамках долгосрочных инициатив ИИ предприятия все чаще применяют фреймы с расширенной генерацией на основе извлечения (RAG). Однако этот переход требует надежной контекстуальной безопасности для удовлетворения растущих потребностей в интеграции.
Безопасность RAG требует контекстного интеллекта
Обычные методы контроля доступа в RAG не обеспечивают необходимого контекстуального наблюдения. Поскольку у RAG нет встроенного контроля доступа, это создает заметный риск безопасности — потенциальную возможность несанкционированного доступа к конфиденциальной информации.
Ограничения традиционных методов контроля доступа
Контроль доступа на основе ролей (RBAC) слишком жесток для адаптации к динамическим контекстуальным запросам, в то время как контроль доступа на основе атрибутов (ABAC) сталкивается с проблемами масштабируемости и имеет высокие затраты на обслуживание. Явно необходим более сложный подход, который усиливает защиту, не жертвуя производительностью.
Введение в Контекстный Контроль Доступа (CBAC)
Осознавая эти недостатки, Lasso Security разработала Контекстный Контроль Доступа (CBAC) для улучшения управления контекстом доступа. CBAC динамически оценивает контекст всех запросов доступа к LLM, включая оценку доступа, ответов, взаимодействий, поведения и запросов на изменение данных. Этот комплексный подход обеспечивает надежную безопасность, предотвращая несанкционированный доступ и поддерживая высокие стандарты внутри LLM и RAG.
Офир Дрор, соучредитель и CPO Lasso Security, подчеркнул: «Традиционные методы ориентированы на статические критерии, не могут эффективно управлять контекстом и могут оставить организации уязвимыми». CBAC исправляет эти недостатки, обеспечивая доступ к конкретной информации только для авторизованных пользователей, тем самым защищая конфиденциальные данные от неуместного раскрытия чат-ботами.
Что такое Расширенная Генерация на Основе Извлечения (RAG)?
В 2020 году исследователи из Facebook AI Research, University College London и Нью-Йоркского университета опубликовали основополагающую статью о RAG, определив ее как метод, который сочетает предварительно обученные модели с непараметрической системой памяти. Благодаря более эффективной обработке корпоративных данных, RAG значительно усиливает возможности LLM.
Gartner объясняет, что RAG устраняет ограничения традиционных LLM, позволяя интеграцию актуальной корпоративной информации. Сопроводительная графика иллюстрирует, как работает RAG.
Разработка CBAC для интеграции RAG
Дрор отметил, что CBAC разработан для гибкости, может функционировать как самостоятельное решение или бесшовно интегрироваться с существующими системами, такими как Active Directory. Эта универсальность упрощает его внедрение без необходимости внесения крупных изменений в текущую инфраструктуру LLM.
Хотя CBAC может работать независимо, он также интегрируется в комплект средств безопасности генеративного ИИ от Lasso Security. Это обеспечивает комплексную защиту взаимодействий сотрудников с ИИ-чат-ботами, приложениями и моделями. Lasso Security постоянно отслеживает передачи данных и быстро выявляет аномалии или нарушения политики, обеспечивая безопасную и соответствующую среду.
Дрор добавил, что CBAC постоянно оценивает различные контекстные показатели для соблюдения политик контроля доступа, позволяя доступ только авторизованным пользователям к конфиденциальной информации даже в документах, содержащих как секретные, так и общедоступные данные.
Решение проблем безопасности
Дрор отметил, что организации, внедряющие RAG, часто сталкиваются с критическими вопросами, касающимися доступа. По мере роста применения RAG ограничения LLM — такие как галлюцинации и трудности с обучением данных — усиливают необходимость решения вопросов разрешений. CBAC был разработан для преодоления этих проблем, предоставляя необходимые контекстуальные сведения для внедрения динамических стратегий контроля доступа.
Поскольку RAG становится ключевым элементом стратегий LLM и ИИ организаций, контекстный интеллект будет жизненно важен для создания безопасных и масштабируемых решений без ущерба для производительности.