Arize, AI 모델 실패 시점 파악을 위한 프롬프트 변수 모니터링 도입

Arize AI의 관측 서비스가 대규모 언어 모델(LLM)에서 프롬프트 데이터가 오류 또는 환각으로 이어지는 시점을 정확히 파악할 수 있도록 돕는 새로운 제품을 출시했습니다. AI 엔지니어를 위해 설계된 이 도구는 복잡한 시스템의 디버깅에 필요한 중요한 통찰력을 제공하며, 종종 몇 줄의 코드에서 발생하는 문제를 격리할 수 있습니다.

Arize의 공동 창립자이자 CEO인 제이슨 로파테키는 “우리는 모두 프롬프트 엔지니어입니다. 우리가 직접 만든 프롬프트를 사용하고 있습니다. 많은 애플리케이션이 템플릿 프롬프트를 사용하는데, 이는 다양한 데이터 셋에 반복적으로 적용되어 사용자 쿼리에 더 나은 답변을 제공합니다. 하지만 이러한 템플릿은 시스템에서 추출된 프롬프트 변수를 기반으로 하며, 작은 데이터 불일치도 LLM 출력에서 환각이나 오류를 초래할 수 있습니다”라고 설명했습니다.

프롬프트 변수를 모니터링하는 것은 AI 기반 고객 서비스 및 지원 챗봇의 맥락에서 필수적입니다. 잘못된 정보는 브랜드의 명성을 해칠 수 있습니다. 단일 LLM을 관리하는 것이 모니터링을 단순화할 수 있지만, 기업은 OpenAI, 구글, 메타, 안트로픽, 미스트랄과 같은 여러 모델을 사용하는 경우가 많아 이 점검이 매우 중요합니다.

로파테키는 잘못된 정보가 환각의 주요 원인이라고 강조합니다. 이러한 오류의 원인을 파악하는 것—모델에 입력된 데이터, 선택된 프롬프트 템플릿 또는 기타 요소가 중요한 시스템 수리에 필수적입니다.

변동성을 이해하는 것도 중요합니다. 이는 AI 모델에서 발생할 수 있는 출력의 범위로, 사소한 조정이나 잘못된 데이터 입력에 의해 영향을 받습니다. 로파테키는 “결정 과정은 단순한 입력-출력 시나리오가 아닙니다. AI 출력은 후속 AI 결정에 피드백을 주며, 변동성이 심각한 문제로 확대될 수 있는 복잡한 망을 형성합니다”라고 설명했습니다.

이러한 문제를 해결하기 위해 Arize는 고급 LLM을 활용해 정교한 AI 시스템을 구축하는 AI 엔지니어를 위해 특별히 도구를 개발하고 있습니다. 로파테키는 “이 엔지니어들은 애플리케이션의 지능을 향상시키기 위해 강력한 도구가 필요합니다. AI 엔지니어의 역할은 앞으로 다방면에서 확산될 것입니다”라고 전했습니다.

로파테키는 Arize가 “AI를 위한 Datadog”이 되기를 희망하며, 클라우드 모니터링 대기업과의 경쟁에서 자리매김하고자 합니다. 그들은 이미 AI 모니터링, 특히 GPT-4와 같은 OpenAI 모델 지원에 진출했습니다. 그러나 로파테키는 Arize가 우위에 있다고 믿습니다. “Datadog과는 다르게, 우리는 AI 분야에서 태어났습니다. 혁신의 속도가 빠르고 그들은 아직 AI 제품을 개발 중입니다.”

그는 효과적인 AI 솔루션 제공의 긴급성을 강조하며, “기업들이 신속하게 배포하려는 과정에서 많은 경우 제한된 시나리오만을 테스트합니다. 이러한 시스템이 실제 환경에서 작동할 때 변동성과 잠재적 문제가 극명해져 수많은 예기치 않은 도전이 발생합니다. 효과적인 디버깅 도구의 필요성은 절박한 상황에 이르렀고, 기업들이 얼마나 많은 문제가 발생할 수 있는지를 인식하기 시작하고 있습니다”라고 덧붙였습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles