메타 AI, 인공지능 에이전트의 '구현된 지능'을 향상시키기 위한 OpenEQA를 출시하다.

Home AI 뉴스 메타 AI, 인공지능 에이전트의 '구현된 지능'을 향상시키기 위한 OpenEQA를 출시하다.

메타 AI 연구진은 "구체적 질문 응답(Embodied Question Answering, EQA)" 능력을 평가하기 위해 설계된 혁신적인 오픈 소스 벤치마크 데이터셋인 OpenEQA를 공개했습니다. 이 기능은 AI가 실제 세계를 이해하고 다양한 환경에 대한 자연어 문의에 정확하게 응답할 수 있도록 합니다.

"구체적 AI" 분야의 핵심 자원으로 자리잡은 OpenEQA 데이터셋은 가정과 사무실 등 180개 이상의 실제 환경에 관한 1,600개 이상의 질문으로 구성되어 있습니다. 이 질문들은 객체 및 속성 인식, 공간 추론, 기능적 추론, 상식 지식 등 AI의 역량을 철저히 평가하기 위해 일곱 가지 유형으로 분류되어 있습니다.

연구자들은 "구체적 질문 응답은 AI 에이전트가 세계를 이해하는 방식을 평가하는 의미 있는 적용 사례이자 프레임워크"라고 강조했습니다. "EQA는 자연어로 질문에 답할 수 있을 만큼 환경을 충분히 이해하는 것을 포함합니다."

특히 GPT-4V와 같은 고급 모델조차 OpenEQA에서 인간 성과와 일치하는 데 어려움을 겪어, 이 벤치마크가 AI의 실제 질문 이해 및 응답 능력을 평가하는 rigor를 반영하고 있습니다.

AI의 다양한 분야 융합

OpenEQA 프로젝트는 컴퓨터 비전, 자연어 처리, 지식 표현, 로봇공학 등 여러 최신 인공지능 분야를 연결합니다. 궁극적인 목표는 주변을 인식하고 상호작용할 수 있는 인공지능 에이전트를 개발하여, 인간과 자연스러운 대화를 나누고 일상생활을 향상시키는 것입니다.

연구자들은 "구체적 지능"의 두 가지 주요 응용 분야를 구상하고 있습니다. 첫째, 증강 현실 안경이나 헤드셋에 통합된 AI 보조기는 비디오 및 센서 데이터를 활용하여 사용자에게 사진과 같은 기억을 제공하며, "내 열쇠를 어디에 두었지?"와 같은 질문에 답할 수 있습니다. 둘째, 이동 로봇은 환경을 자율적으로 탐색하며 "커피가 남아있나?"와 같은 정보를 수집할 수 있습니다.

철저한 평가 기준 수립

OpenEQA 데이터셋을 개발하기 위해 메타 연구진은 실제 환경의 비디오 영상 및 3D 스캔을 수집하는 것으로 시작했습니다. 그 후, 시각적 데이터에 접근할 수 있는 AI 보조기에게 제기할 질문을 작성할 수 있는 사람들을 초대했습니다.

이 데이터셋은 다양한 인식 및 추론 능력을 평가하는 1,636개의 질문을 포함하고 있습니다. 예를 들어, "식탁 주위에 의자가 몇 개 있나요?"라는 질문에 답하기 위해서는 AI가 객체를 식별하고 "주위"라는 공간 개념을 이해하며 해당 항목을 세어야 합니다. 다른 질문들은 객체의 용도와 속성에 대한 기본적인 이해를 필요로 합니다.

정확성을 높이기 위해 각 질문에는 여러 인간-generated 답변이 포함되어 있으며, 다양한 응답이 가능함을 인정합니다. AI 성능을 평가하기 위해 연구자들은 대형 언어 모델을 활용하여 AI가 생성한 답변과 인간의 응답 간 유사성을 자동으로 측정했습니다.

Snowflake Copilot: Mistral 대규모 AI 보조 도우미, 이제 공개 미리보기 제공

Buildbox 4, 노코드 AI 게임 개발 엔진 공개 - 손쉬운 게임 제작의 새로운 시대 열다

Most people like

OpenRouter

1.4M

AI 모델 및 LLM 라우터 소개: AI 애플리케이션의 성능 및 효율성을 향상시키는 관문.

AI 모델 Large Language Models (LLMs)

Audimee

255K

목소리의 힘을 여러분의 것으로 만들어보세요. 우리의 첨단 음성 변환 도구는 여러분의 목소리 퍼포먼스를 한층 끌어올리도록 설계되었습니다. 음악가, 팟캐스터, 콘텐츠 제작자 누구에게나 이 혁신적인 기술은 목소리를 손쉽게 변형하고 향상시킬 수 있는 기회를 제공합니다. 한계는 잊고, 사운드의 무한한 가능성을 만나보세요. 우리의 도구가 어떻게 여러분의 청중을 사로잡는 전문적인 품질의 결과를 이끌어 낼 수 있는지 알아보세요!

음성 변환 도구 Voice & Audio Editing

Subtxt

45.5K

Subtxt는 이야기꾼들이 매력적인 이야기를 작성할 수 있도록 돕기 위해 설계된 최첨단 글쓰기 도구입니다. 지능형 기능을 갖춘 Subtxt는 사용자가 이야기 스킬을 향상시키고 독자와 효과적으로 소통할 수 있도록 지원합니다.

개요 도구 AI Book Writing

DreamPic.AI

11.1K

DreamPic.AI는 고급 AI 기술을 활용하여 다양한 예술적 스타일에 맞춰 사용자 취향에 맞는 맞춤형 이미지를 생성합니다.

AI 생성 이미지 AI Art Generator

Find AI tools in YBX