프리온, 즉각적이고 안전하며 신뢰할 수 있는 답변을 위한 검색 보강 생성 기능 향상

오늘날의 대형 언어 모델(LLM)은 점점 더 정교해지고 있습니다. 그러나 이들이 응답 생성을 위해 의존하는 데이터는 종종 정적이며, 이로 인해 정보가 수주 또는 수개월 뒤로 낭비될 수 있습니다. 이러한 문제는 현재의 기업에 있어 최신 정보와 회사 고유의 출력 생성이 가능한 검색 보조 생성(RAG)의 필요성을 더욱 부각시켰습니다. 하지만 검색 과정은 특히 복잡한 기업 콘텐츠를 다룰 때 정확성, 확장성 및 보안에서 어려움을 겪을 수 있습니다.

이러한 문제를 해결하기 위해 프라이온은 복잡하고 분산된 콘텐츠에서 정보를 안전하게 추출하는 고급 플랫폼인 프라이온 검색 엔진을 도입했습니다. 이를 통해 조직은 오늘날의 AI 도구의 잠재력을 극대화할 수 있습니다. 프라이온의 사장인 크리스 마흘은 "생성된 콘텐츠의 신뢰성에 의문이 있으며, 편향도 중요한 문제입니다. 일부 모델은 기본적으로 시간에 동결되어 있어, 통찰력 있는 질문을 던져도 답변은 낡은 정보에서 나오는 문제가 있습니다."라고 설명했습니다.

일관된 지식 기반 구축하기

현재 데이터 수집 방법은 복잡한 문서 기반 콘텐츠에서 자주 실패하여 대규모의 정확성을 달성하기 어렵습니다. 또한 콘텐츠는 다양한 시스템과 형식에 산재해 있습니다. 프라이온 검색 엔진은 이러한 장애물을 극복하며 수백만 개의 기업 데이터를 하나의 일관된 지식 기반으로 통합합니다. 이 시스템은 의미적 신경망, 문서 분석, 독점적인 광학 문자 인식(OCR)을 활용하여 이미지, 그래픽, 표 및 손글씨에서 텍스트를 추출합니다. 비디오 세분화를 통해 주요 요소를 식별하고 콘텐츠 정규화 및 시각적 의미 세분화를 적용하여 문서를 분류합니다.

사용자는 다양한 형식으로 질문을 던질 수 있으며, 몇 밀리초 만에 답변을 받을 수 있습니다. 마흘은 이 다층 정보 시스템을 "지식 패브릭"이라고 설명하며 단순한 검색을 넘어서는 복잡성을 강조했습니다. 보안을 위해 프라이온은 접근 제어 목록(ACL)을 포함해 사용자 접근 권한을 정의합니다. 이 시스템은 온프레미스, 공공 및 사설 클라우드 환경, 그리고 공기 간섭 방지 상황에서도 배포에 적합합니다.

미리 구축된 구성 요소를 통해 조직은 단 2주 만에 생산 준비가 완료된 생성 AI 애플리케이션을 구현할 수 있으며, 코드 없는 인터페이스를 통해 실시간 콘텐츠 업데이트가 가능합니다. 이 엔진은 API 지원으로 맞춤형 배포가 가능하며 마이크로소프트 쉐어포인트, 컨플루언스, AWS S3, 구글 드라이브, 젠데스크, 서비스나우, 세일즈포스와 원활하게 통합됩니다. 마흘은 "모든 독점 정보는 형식에 상관없이 복잡한 도면에서 방대한 보고서까지 안전하게 끌어올려지며, 사용자들은 대화 형식으로 정확하고 출처가 명확한 답변을 얻을 수 있습니다."라고 언급했습니다.

산업 전반의 응용

한 고객은 프라이온 온프레미스를 활용해 5,000명이 접근하는 40만 개 기술 문서를 통합했으며, 몇 밀리초 만에 정확한 답변을 제공했습니다. 또 다른 경우에서는 소비자 게임 기술 회사가 프라이온을 활용해 수백만 고객의 복잡한 기술 문의에 답변했습니다. 이 포털은 사용자가 자연어로 질문할 수 있도록 하며, 하루 여러 번 업데이트됩니다.

유사하게 프라이온은 엔지니어링 회사에 신속하게 수백만 문서에 접근할 수 있도록 지원했습니다. 보험사들도 언더라이팅 프로세스를 개선하기 위해 프라이온을 통합했으며, 복잡한 제품을 가진 기업들은 판매 팀에게 즉각적인 지식을 제공하기 위해 이 엔진을 사용하고 있습니다. 마흘은 "검색 데이터 레이어, 즉 RAG 준비 완료 데이터 레이어는 조직의 가장 중요한 자산입니다."라고 덧붙였습니다. "따라서 이 정보를 관리하기 위한 안전하고 확장 가능한 인프라를 갖추는 것이 필수적입니다."

조직 내 단편화된 데이터 탐색하기

데이터는 조직의 가치의 기초지만, 그 이해도는 종종 제한적입니다. 데이터는 비디오, 긴 텍스트, 이메일, 금융 문서, 심지어 마이크로피시 등 다양한 형태로 존재해 중요 정보를 정확히 파악하기 어렵습니다. 기업은 제품 개발을 가속화할 수 있는 방대한 복잡한 고급 데이터를 보유하고 있지만, 특정 프로젝트를 위해 관련 데이터를 찾는 것은 거의 불가능할 수 있습니다. 예를 들어, 반도체 엔지니어링 회사는 여러 연구 부서에 걸쳐 수백만 개의 문서를 보유할 수 있습니다.

마흘은 "저명한 기업들과 함께 일하며 정보가 얼마나 단편화되어 있는지 깨닫는 것은 매우 뜻깊었습니다. 생성 AI가 이제 등장했지만, 조직 내 데이터 단편화로 인한 큰 도전에 직면하고 있습니다."라고 말했습니다. 그는 데이터 보안의 중요성을 강조하며, 생성 AI에 대한 기대가 크지만 깊은 개인 정보 및 데이터 보안 우려도 있다고 경고했습니다. 전 세계적으로 생성 AI가 연간 최대 4.4 조 달러의 경제적 혜택을 창출할 것으로 예상되지만, 조직들은 독점 데이터를 공공 LLM 및 클라우드에 노출하는 것에 대해 조심스러워하고 있습니다. 마흘은 "안전성, 안전성, 안전성을 계속 강조합니다."라고 강조했습니다. "이 수준의 보안 관리는 우리의 기본 원칙 중 하나입니다."

AI에서 질문 이해 향상하기

정확한 답변을 제공하기 위해 AI는 먼저 질문의 뉘앙스를 파악해야 합니다. 프라이온의 시스템은 헤더부터 디자인 레이아웃까지 질문의 복잡성을 이해하도록 설계되었습니다. 이 엔진은 쿼리 확장, 도메인 외 감지 및 쿼리 임베딩을 활용하여 자연어 쿼리를 해석하고, 세 가지 독점 모델을 사용하여 관련 콘텐츠를 식별하고 순위를 매깁니다. 마흘은 사람들이 같은 주제에 대해 다양한 방식으로 질문하는 점에 주목했습니다. 예를 들어, "올해 수익이 작년보다 얼마나 증가했나요?"와 "작년 수익은 얼마였나요?"는 다릅니다. "정보를 체계적으로 조직하면 여러 방식으로 제기된 질문에 정확히 응답할 준비가 되는 것이 중요합니다."라고 마흘은 설명했습니다. 이 과정은 기본 질문을 분석하고 콘텐츠를 평가하며 다양한 질문 세트를 생성하는 것을 포함합니다.

AI 응답의 정확한 출처 보장하기

출처 표기는 모델이 '환각'을 일으키거나 잘못된 정보를 제공하는 것을 방지하는 데 중요합니다. 마흘은 "많은 사람들이 ChatGPT와 다른 모델을 사용하지만, 답변이 어디에서 오는지 명확하지 않을 수 있습니다."라고 인정했습니다. 프라이온은 모든 생성된 답변이 신뢰할 수 있는 정통한 정보 출처에서 나오는 것을 보장하여 이를 명확히 합니다. 이를 통해 사용자는 여러 출처에서 응답을 받을 수 있으며, 모든 내용은 명확한 참조로 제공됩니다. "프라이온의 플랫폼은 CIO, CTO 및 기술자들이 비정형 및 준정형 정보를 스스로 제어하고 성능을 최적화할 수 있도록 설계되었습니다."라고 마흘은 결론지었습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles