애플 연구원들, GPT-4 성능을 초월하는 혁신적인 AI 시스템 공개

애플 연구팀은 음성 비서의 명령 이해 및 응답 능력을 크게 향상시키기 위해 ReALM(참조 해소를 위한 언어 모델링)이라는 AI 시스템을 개발했습니다. 최신 연구 논문에서 애플은 ReALM이 대규모 언어 모델을 활용하여 참조 해소 문제를 해결하는 방법을 설명하고 있습니다. 이 시스템은 화면의 모호한 참조를 해석하고 문맥 속에서 대화를 이해하는 데 뛰어난 성능을 발휘하여 장치와의 상호작용을 더 직관적이고 자연스럽게 만듭니다.

참조 해소는 자연어 이해의 핵심 요소로, 사용자가 대화에서 대명사와 간접 참조를 사용하더라도 혼란을 일으키지 않도록 합니다. 그러나 다양한 언어 신호와 시각 정보를 처리하는 복잡성 때문에 디지털 비서에게는 큰 도전 과제가 되어왔습니다. ReALM은 이 복잡한 과정을 간단한 언어 모델링 작업으로 단순화하여, 대화 중 화면의 시각적 요소에 대한 참조를 더 잘 이해할 수 있도록 합니다.

ReALM은 텍스트 표현을 통해 화면의 시각적 레이아웃을 재구성하고, 화면에 있는 요소와 그 위치를 분석하여 화면의 내용과 구조를 반영하는 텍스트 형식을 생성합니다. 애플 연구팀은 특별히 조정된 언어 모델이 기존의 방법, 예를 들어 OpenAI의 GPT-4와 비교할 때 참조 해소 작업에서 현저히 더 나은 성능을 보인다는 것을 발견했습니다.

이러한 발전은 사용자가 화면에 표시된 내용을 바탕으로 디지털 비서와 더 효율적으로 상호작용할 수 있게 하여, 정밀하고 상세한 설명이 필요하지 않게 합니다. 이는 운전 중 내비게이션 정보를 제공하거나 장애인을 위한 간단하고 정확한 간접 상호작용을 제공하는 등 음성 비서의 응용 가능성을 크게 확장합니다.

최근 애플은 인공지능 관련 여러 연구를 발표했으며, 특히 지난달 텍스트와 시각 정보를 원활하게 통합하는 대규모 언어 모델 훈련 방법이 주목받고 있습니다. 오는 6월 WWDC 컨퍼런스에서 애플이 다양한 새로운 AI 기능을 공개할 것으로 기대되고 있습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles