오픈소스 Ray 프레임워크는 복잡하고 자원 집약적인 작업을 위해 수천 개의 조직에서 널리 사용되고 있습니다. 특히, GPT-3는 이 프레임워크에서 훈련되어 대형 언어 모델(LLM) 세계에서의 중요성을 강조합니다.
최근 발견된 “ShadowRay” 취약점은 심각한 우려를 불러일으켰습니다. 이 취약점은 7개월 동안 공격자들에게 수천 개 기업의 민감한 AI 생산 작업에 접근할 수 있는 경로를 제공하여 컴퓨팅 파워, 자격 증명, 비밀번호, 키, 토큰 및 기타 중요한 데이터를 위험에 빠뜨렸습니다.
프레임워크의 유지 관리자인 Anyscale은 처음에 취약점의 심각성을 반박했으나, 이후에는 사용자들이 포트 노출 여부를 확인할 수 있는 새로운 도구를 발표했습니다. Anyscale 대변인은 “악의적인 활동 보고를 고려하여, 우리는 클러스터의 적절한 설정을 검증할 수 있는 도구를 신속히 제공했습니다.”라고 밝혔습니다.
CVE-2023-48022로 식별된 이 취약점은 Ray Jobs API를 원격 코드 실행 공격에 노출시킬 수 있습니다. 즉, 대시보드 네트워크에 접근할 수 있는 누구나 무단 작업을 실행할 수 있는 가능성이 있다는 것입니다. Oligo Security의 최근 보고서에 따르면, Anyscale은 이 문제를 처음에는 예상되는 행동으로 간주했으나, 이제는 Open Ports Checker를 도입했습니다. 이 도구는 예기치 않게 열린 포트를 식별하는 과정을 간소화합니다. 클라이언트 측 스크립트는 기본적으로 미리 구성된 Anyscale 서버에 연락해 “OK” 메시지 또는 열린 포트에 대한 “WARNING” 보고서를 반환합니다.
“WARNING”은 서버가 포트에서 무언가를 감지했다는 뜻이나, 비인증된 트래픽에 대한 열린 접근을 반드시 나타내는 것은 아닙니다. “OK” 응답은 어떤 포트로도 연결이 이루어지지 않았음을 나타내지만, Anyscale은 이 응답이 포트가 열려있지 않음을 보장하지 않으며, 방화벽이나 NAT 규칙과 같은 잠재적인 구성의 영향을 받을 수 있다고 경고합니다.
Anyscale은 커뮤니티가 이 네트워크 경로를 명확히 확인할 수 있도록 테스트를 주최할 계획입니다. 이 저장소는 Apache2 라이선스 하에 제공되며, 모든 Ray Head 또는 Worker Node에서 배포할 수 있고, 모든 Ray 버전에서 작동하며, Ray API를 통해 기존 포트를 반환합니다. 사용자는 경량 웹 서버에 테스트 네트워크 호출을 보내도록 구성할 수도 있으며, 원하는 경우 자신의 서버로 호출을 보낼 수도 있습니다.
‘ShadowRay’ 취약점은 패치가 없었기 때문에 대부분 간과되었습니다. 이로 인해 일반적인 스캔에서 종종 간과되는 “그림자 취약점”으로 여겨졌습니다. Oligo Security에 따르면, 이 취약점은 다음에 영향을 미쳤습니다:
- AI 생산 작업
- 클라우드 환경(AWS, GCP, Azure, Lambda Labs) 및 민감한 클라우드 서비스 접근
- Kubernetes API 접근
- OpenAI, Stripe 및 Slack의 자격 증명
- 생산 데이터베이스 자격 증명
- OpenAI, Hugging Face, Stripe 및 Slack의 토큰
3월 28일 기준으로 Censys는 전 세계 315개의 영향을 받은 호스트를 확인했으며, 77% 이상이 로그인 페이지를 노출하고 여러 개가 파일 디렉터리를 공개했습니다.
전문가들은 ‘ShadowRay’가 특정 애플리케이션이 아닌 기반 인프라를 겨냥하기 때문에 심각한 위험을 초래한다고 경고합니다. Blackpoint Cyber의 위협 인텔리전스 이사 Nick Hyatt는 위협 행위자들이 이론적인 AI 기반 공격보다 인프라를 침해함으로써 훨씬 더 많은 정보를 얻을 수 있다고 지적합니다.
많은 사람들은 이 인프라가 안전하다고 가정하며, 이는 LLM이 사용하는 데이터에 대한 태만을 초래합니다. 이러한 인식은 공격자들이 대량의 민감한 정보에 접근할 기회를 만듭니다. Orca Security의 Neil Carpenter는 강력한 보안 조치 없이 오픈소스 AI 프로젝트를 출시하는 것이 어렵다고 강조하며, 종종 중요한 구성 요소에 대한 불충분한 문서화에 의존한다고 덧붙입니다.
‘ShadowRay’의 문제는 기술적 측면에 국한되지 않으며, 사람, 프로세스 및 기술을 포함하는 포괄적인 논의가 필요합니다. 생성적 AI가 계속 발전함에 따라 Hyatt는 직접적인 위협보다 인프라 공격의 증가가 있을 것이라고 예측합니다. 데이터가 쉽게 이용 가능하고 취약점이 흔한 상황에서, 공격자들은 침투를 위해 AI를 직접 사용하는 것보다 더 쉬운 경로를 찾을 수 있습니다.