애플 연구원들, ReALM 장치 모델이 GPT-4를 초월하여 시리의 지능을 크게 향상시킨다고 주장

Home Hardware 애플 연구원들, ReALM 장치 모델이 GPT-4를 초월하여 시리의 지능을 크게 향상시킨다고 주장

애플의 ReALM 모델, Siri의 지능을 향상시키다

4월 2일, 애플이 Siri의 기능을 크게 향상시키기 위해 새로운 인공지능 모델인 ReALM을 개발하고 있다는 소식이 전해졌습니다. 최근 연구에 따르면, ReALM은 OpenAI의 유명한 언어 모델인 GPT-4.0보다 우수한 성능을 보이지만, 현재 Siri의 이미지 설명 능력은 여전히 일관성이 부족한 상황입니다.

ReALM의 주요 기능

ReALM은 사용자의 화면에 표시된 내용과 수행 중인 작업을 동시에 이해할 수 있는 능력이 특징입니다. 이 모델은 정보를 세 가지 유형으로 분류합니다:

1. 스크린 엔티티: 사용자의 화면에 현재 표시되고 있는 콘텐츠.

2. 대화 엔티티: "엄마에게 전화 걸기"와 같은 명령에 포함된 "엄마"의 연락처 정보 등 진행 중인 대화와 관련된 정보.

3. 백그라운드 엔티티: 음악 재생이나 알람과 같은 사용자의 현재 화면 콘텐츠나 동작과 직접 관련되지 않은 엔티티.

ReALM이 완전하게 운영될 경우, Siri는 훨씬 더 똑똑하고 유용해질 것입니다. 연구팀은 ReALM과 OpenAI의 GPT-3.5 및 GPT-4.0 간의 성능 비교를 진행하였고, 중요한 통찰을 얻었습니다:

“우리는 GPT-3.5와 GPT-4.0 모델에 상황 정보를 제공하여 다양한 엔티티를 예측하는 테스트를 진행했습니다. GPT-3.5는 텍스트 입력만 처리하지만, GPT-4는 이미지 데이터를 이해할 수 있어 스크린 엔티티 식별 능력이 크게 향상되었습니다.”

ReALM의 인상적인 결과

ReALM은 다양한 유형의 엔티티 인식에서 놀라운 진전을 보였습니다. 가장 작은 모델은 기존 시스템에 비해 스크린 엔티티 인식 정확도가 5% 이상 향상되었습니다. GPT-3.5 및 GPT-4.0과 비교할 때, 우리의 가장 작은 모델은 GPT-4.0과 동등한 성능을 보였고, 더 큰 모델은 이를 훨씬 능가했습니다.

연구의 결론 중 하나는 ReALM이 GPT-4보다 파라미터 수가 상당히 적음에도 불구하고, 특정 맥락에서 사용자 명령을 처리할 때 경쟁력 있는 성능을 발휘하여 효율적인 온디바이스 엔티티 인식 시스템으로 자리잡을 수 있다는 점입니다.

애플에게 있어 도전 과제는 이 기술을 기기에 효과적으로 배치하면서 성능을 저하시키지 않는 것입니다. WWDC 2024 개발자 컨퍼런스가 6월 10일에 다가오면서, 업계는 iOS 18 및 기타 차세대 시스템에서 애플의 새로운 AI 혁신을 기대하고 있습니다.

애플 연구팀, 화면 콘텐츠 이해 가능한 '비전' 기능 갖춘 AI 시스템 공개

삼성, 더 스마트한 지원을 위한 Bixby의 생성적 AI 기능 강화

Most people like

Alethea

17.6K

알레시아 AI는 생성적 AI의 힘과 블록체인 기술을 결합하여 역동적이고 매력적인 인터랙티브 AI 캐릭터를 만듭니다. 이러한 최첨단 혁신을 활용함으로써 알레시아 AI는 디지털 상호작용을 경험하는 방식을 혁신합니다.

알레시아 AI AI Character

Wirestock

373.3K

당신의 창의력을 발휘하고 오늘 바로 수익을 창출하세요! 멋진 사진, 매력적인 AI 아트, 재미있는 동영상을 쉽게 판매하세요. 열정을 수익으로 바꾸고 창의력을 돈으로 만들어 보세요.

수익 창출 AI Content Generator

skills.ai

58.8K

skills.ai는 데이터 과학자를 위해 특별히 설계된 혁신적인 AI 도구입니다. 이 도구는 코딩 프로세스를 간소화하고, 데이터 시각화를 개선하며, 귀중한 통찰력을 발견하고, 효과적인 프레젠테이션 생성을 단순화합니다. skills.ai를 통해 데이터 전문가들은 더 효율적이고 효과적으로 작업할 수 있으며, 분석 워크플로우를 혁신할 수 있습니다.

기타 AI Analytics Assistant

TranslateImage

64.1K

이미지를 원본 텍스트 형식을 변경하지 않고 여러 언어로 변환하세요. 이 과정은 콘텐츠의 시각적 일관성을 유지하면서 전 세계의 다양한 청중에게 접근 가능하도록 합니다. 이미지 번역을 통해 언어 장벽을 넘는 소통을 강화하는 방법을 살펴보세요.

이미지 번역 Translate

Find AI tools in YBX