메타, AI 보안을 강화하기 위한 퍼플 라마 이니셔티브 출시
생성형 AI 개발에 강력한 보안 프레임워크의 필요성을 인식한 메타는 최근 퍼플 라마 이니셔티브를 소개했습니다. 이 혁신적인 프로그램은 사이버 보안 개념인 퍼플 팀에서 영감을 받아 공격(red team)과 방어(blue team) 전략을 결합하여 AI 기술의 신뢰를 높이고 공격 위험을 완화하는 것을 목표로 합니다.
퍼플 팀의 이해
퍼플 라마 이니셔티브는 공격과 방어 방법론을 통합하여 잠재적인 사이버 보안 위협을 평가하고 식별하며 완화합니다. "퍼플"이라는 용어는 공격과 방어 전술의 조화로운 통합을 상징하며, 메타의 AI 시스템의 안전성과 신뢰성에 대한 헌신을 강조합니다.
왜 지금 퍼플 라마 이니셔티브를 출시했는가
콘스텔레이션 리서치의 부사장인 앤디 투라이(Andy Thurai)는 "퍼플 라마는 메타에게 중요한 진전을 의미합니다. 메타는 AI 모델의 신뢰성과 거버넌스를 증진하기 위해 IBM AI 얼라이언스에 참여한 후, 위원회의 작업이 완전히 끝나기 전에 도구와 프레임워크를 적극적으로 출시하고 있습니다."라고 설명했습니다. 메타의 발표는 "생성형 AI가 챗봇부터 이미지 생성기까지 혁신을 촉진함에 따라, 이 회사는 AI 안전성에 대한 협력을 촉진하고 새로운 기술에 대한 신뢰를 증진하고자 한다"고 강조했습니다. 이 이니셔티브는 AI 커뮤니티 간의 협력적 노력을 통해 책임 있는 생성형 AI 개발로의 중요한 전환을 나타내며, 종합적인 기준, 지침 및 도구가 특징입니다.
이 이니셔티브의 주요 목표 중 하나는 생성형 AI 개발자에게 백악관의 책임감 있는 AI 개발 약속에 맞출 수 있는 리소스를 제공하는 것입니다.
퍼플 라마 이니셔티브에서 출시된 주요 도구
메타는 대형 언어 모델(LLMs)을 위한 사이버 보안 평가 기준인 CyberSec Eval과 효과적인 입력/출력 필터링을 위한 안전 분류기인 Llama Guard를 소개하며 퍼플 라마 프로그램을 시작했습니다. 또한, 이 프레임워크를 구현하기 위한 최선의 방법을 개괄한 책임 있는 사용 가이드를 발표했습니다.
협력: AI 보안의 초석
메타의 크로스 협력에 대한 헌신은 AI 개발 전략의 근본이며, 개방적인 생태계를 조성하는 것을 목표로 합니다. 그러나 업계의 경쟁적 성격으로 인해 이러한 목표를 달성하는 것은 도전적이며, 메타는 AMD, AWS, Google Cloud, Hugging Face, IBM, Intel, Lightning AI, Microsoft, MLCommons, NVIDIA, Scale AI 등 새로운 AI 얼라이언스의 파트너와 성공적으로 협력하여 오픈 소스 커뮤니티에 제공되는 도구를 향상시켰습니다.
투라이는 "메타가 원래 얼라이언스에 포함되지 않았던 AWS, Google, Microsoft, NVIDIA와 같은 산업 리더와 협력하려고 하는 것도 주목할 만한 점입니다."라고 언급했습니다.
메타는 공동 목표를 중심으로 파트너를 통합한 검증된 역사를 가지고 있습니다. 7월에는 100개 이상의 파트너와 함께 Llama 2를 출시했으며, 이들 중 많은 이들이 지금 메타와 협력하여 신뢰와 안전 관련 이니셔티브를 진행하고 있습니다. 메타는 또한 NeurIPS 2023에서 이러한 도구에 대해 깊이 논의하는 워크숍을 개최할 예정입니다.
CIO, CISO 및 CEO가 이끄는 기업들에게 이러한 수준의 협력을 목격하는 것은 생성형 AI에 대한 신뢰를 키우고 모델 제작 및 배포를 위한 DevOps 투자에 대한 정당성을 부여하는 데 중요합니다. 경쟁자들도 공동의 유익한 목표를 위해 협력할 수 있다는 것을 입증함으로써, 메타와 파트너들은 솔루션의 신뢰성을 높일 기회를 갖습니다. 신뢰는 판매와 마찬가지로 시간이 지남에 따라 일관된 행동을 통해 구축됩니다.
유망한 시작이지만 더 많은 행동이 필요
투라이는 "제안된 도구 세트는 LLM 개발자들이 보안 위험을 평가하고 불안전한 코드 출력을 평가하며, 이러한 모델이 악의적인 사이버 공격에 악용되지 않도록 돕기 위해 설계되었습니다. 이는 칭찬할 만한 첫걸음이지만, 더 많은 노력이 필요합니다."라고 조언했습니다.