2024 모바일 월드 콩그레스에서 Qualcomm은 Android 스마트폰에 사용되는 Snapdragon 시리즈 칩의 AI 기능에서 중요한 발전을 선보였습니다. 데모에서는 음성 인식 미디어 편집, 장치 내 이미지 생성, 대규모 언어 모델(LLM) 기반의 지능형 가상 비서 등 다양한 혁신적인 AI 애플리케이션이 포함되었습니다.
Qualcomm의 주목할 만한 기능 중 하나는 대화형 언어 및 비전 비서(LLaVa)를 스마트폰에서 직접 실행할 수 있는 것입니다. 이 비서는 ChatGPT와 유사한 대화 능력과 Google Lens의 이미지 처리 기능을 결합합니다. 사용자는 접시의 이미지를 업로드하고 그 내용에 대해 질문할 수 있으며, AI 비서는 70억 이상의 매개변수를 가진 다중 모달 모델을 활용하여 과일, 치즈, 육류 및 견과류와 같은 재료를 식별합니다.
특히, 이 비서는 이미지 입력과 지속적인 대화를 모두 지원하여 사용자 경험을 향상시킵니다. OpenAI의 ChatGPT와 Copilot과 달리, Qualcomm의 솔루션은 데이터를 장치에서 직접 처리하여 더 빠른 응답 시간과 개선된 개인정보 보호를 제공합니다. Qualcomm은 이 LLaVa 기반의 가상 비서가 사용자 개인 정보 보호, 신뢰성 및 개인화를 강화한다고 강조합니다.
또한 Qualcomm은 LoRA(저순위 적응) 기술에 기반한 이미지 생성 기능을 소개했습니다. 이 접근 방법은 DALL·E와 같은 기존 생성 AI 도구와 달리 모델 매개변수 감소를 통해 훈련 과정을 최적화합니다. 이 최적화는 메모리 요구 사항을 줄이고 처리 속도를 높여, LoRA가 모바일 장치에 더욱 효율적으로 활용될 수 있게 합니다.
Qualcomm은 또한 이미지를 확장하여 생성된 AI를 활용하는 기능과 AI 생성 비디오 기능을 조명했으며, 이는 이미 삼성 갤럭시 S24 울트라에 구현되어 있습니다. MWC 2024에서의 Qualcomm 전시는 스마트폰 AI 기술에서의 리더십을 강조하며, 이러한 혁신들이 모바일 사용자 경험을 어떻게 변화시킬지 업계의 주목을 받고 있습니다.