챗봇 허위정보 대응: 구글 딥마인드와 스탠포드 대학, AI 사실 확인 도구 출시

Home Hardware 챗봇 허위정보 대응: 구글 딥마인드와 스탠포드 대학, AI 사실 확인 도구 출시

3월 31일, 최근 보고서에 따르면 AI 챗봇 기술의 발전에도 불구하고 공통적인 문제가 지속되고 있습니다. 바로, 이 시스템들이 종종 사실과 무관한 답변을 제공한다는 것입니다. 이러한 현상은 "환각"이라고 불리며, AI가 믿을 수 있을 것처럼 보이는 잘못된 정보를 생성할 때 발생합니다.

이 문제를 해결하기 위해 Google DeepMind와 스탠포드 대학의 연구자들은 Search-Enhanced Fact Evaluator(그러니까 SAFE)라는 도구를 개발했습니다. 이 도구는 대규모 언어 모델을 활용하여 챗봇이 생성한 긴 응답을 사실 확인합니다. 연구 결과, 실험 코드 및 데이터셋이 공개되었습니다.

SAFE 시스템은 AI가 생성한 답변의 정확성과 진위를 검증하기 위해 네 단계의 과정을 거칩니다. 첫째, 응답을 검증이 필요한 개별 주장으로 나눕니다. 둘째, 필요한 경우 이러한 주장을 수정합니다. 셋째, 주장을 구글 검색 결과와 비교합니다. 마지막으로, 각 사실이 원래의 질문과 얼마나 관련이 있는지를 평가합니다.

시스템의 효과를 평가하기 위해 연구자들은 약 16,000개의 사실을 포함하는 데이터셋인 LongFact를 만들었고, Claude, Gemini, GPT, PaLM-2를 포함한 13개의 대규모 언어 모델에서 SAFE를 테스트했습니다. 100개의 논란이 있는 사실을 분석했을 때, SAFE는 추가 검토 후 76%의 정확도를 달성했습니다. 또한, 이 프레임워크는 수동 주석보다 20배 이상의 비용 효율성을 보여주었습니다. 이러한 발전은 AI 챗봇의 신뢰성을 높이는 중요한 단계를 의미합니다.

삼성, 더 스마트한 지원을 위한 Bixby의 생성적 AI 기능 강화

구글: 모바일 AI 모델이 상당한 메모리 자원을 소모합니다.

Most people like

ChatKit

19.5K

개선된 사용자 인터페이스와 기능성을 높이는 실용적 기능으로 ChatGPT 경험을 한층 끌어올리세요.

사용자 인터페이스 AI Developer Tools

Friends & Fables

133.4K

AI 던전 마스터와 함께 D&D 5e를 전혀 새로운 방식으로 경험하세요. 혼자서의 모험을 즐기거나 다인용 캠페인에 참여할 수 있으며, 언제 어디서나 편리하게 가능합니다. AI의 힘으로 테이블탑 게임의 무한한 가능성을 발견해 보세요!

D&D 5판 Other

Super Teacher

5.6K

슈퍼티처는 3세에서 8세 아동을 위해 다양한 과목에서 무제한 개인 수업을 제공하며, 전통적인 개인 튜터링보다 뛰어난 성과를 보여줍니다.

교육 AI Education Assistant

Vanchat

6.2K

AI 쇼핑 비서가 Shopify에서 고객 상호작용을 어떻게 변화시켜 참여를 유도하고 매출을 증가시킬 수 있는지 알아보세요. 첨단 기술을 활용한 이 혁신적인 도구는 모든 사용자를 위해 쇼핑 경험을 매끄럽고 개인화된 형태로 개선합니다. 고객의 니즈를 이해하는 지능형 비서로 오늘 바로 Shopify 매장을 한 단계 끌어올리세요.

AI 챗봇 E-commerce Assistant

Find AI tools in YBX