퀄컴, 혁신적인 AI 도구로 여러분의 안드로이드 폰을 향상시키다.

모바일 월드 Congress 2024에서 Qualcomm은 Snapdragon 시리즈를 기반으로 한 AI 기능 포트폴리오를 확장하고 있습니다. 이미 Snapdragon 8 Gen 3 플래그십을 위해 음성 인식 미디어 편집, Stable Diffusion을 활용한 기기 내 이미지 생성, 그리고 Meta의 대형 언어 모델을 활용한 고급 가상 비서와 같은 놀라운 AI 기능을 공개했습니다.

오늘 Qualcomm은 이러한 AI 기능의 향상을 소개했습니다. 주요 특징 중 하나는 스마트폰에 특화된 새로운 대형 언어 및 비전 비서(LLaVa)입니다. 이 혁신적인 도구는 ChatGPT와 유사한 챗봇처럼 작동하지만 Google Lens 기능도 통합되어 있습니다. 이를 통해 Qualcomm의 솔루션은 텍스트 입력과 이미지를 모두 처리할 수 있습니다.

예를 들어, 과일과 치즈, 육류, 견과류가 포함된 charcuterie 보드 사진을 올리면 AI 비서가 해당 이미지를 분석하여 다양한 내용을 식별합니다. 이 비서는 70억 개 이상의 매개변수를 처리하는 대형 다중 모달 모델(LMM)을 기반으로 하여 후속 질문도 효과적으로 처리할 수 있어 자연스러운 대화 흐름을 지원합니다. ChatGPT와 유사한 제품들도 다중 모달 기능을 추가했지만, 클라우드 기반 아키텍처에 의존하므로 데이터 처리에 원격 서버를 사용합니다. 반면 Qualcomm의 접근 방식은 기기 내 처리를 중점적으로 하여 더욱 빠른 응답과 향상된 개인 정보 보호를 보장하며, 데이터 침해 위험을 최소화합니다. Qualcomm은 “이 LMM은 기기에서 즉각적인 토큰 속도로 작동하여 개인 정보 보호, 신뢰성, 개인화, 비용 효율성을 높입니다.”라고 강조했습니다. Qualcomm의 LLaVa 기반 가상 비서가 독립형 앱으로 출시될지, 요금이 부과될지에 대한 구체적인 사항은 확인되지 않았습니다.

Qualcomm의 다음 중요한 발표는 이미지 생성 및 조작의 창의적인 측면에 대해 다룹니다. 최근 Qualcomm은 Stable Diffusion 기술을 활용하여 스마트폰에서 세계에서 가장 빠른 텍스트-이미지 생성을 시연했습니다. 오늘 회사는 LoRA 기반의 이미지 생성을 미리 보여주었습니다.

LoRA(Low-Rank Adaptation)는 Microsoft에서 개발한 새로운 기술로, DALL·E와 같은 전통적인 생성 AI 도구와는 다른 이미지 생성 접근 방식을 제공합니다. AI 모델 훈련은 비용이 많이 들고 느리며 하드웨어 집약적일 수 있습니다. LoRA는 모델 무게를 크게 줄이고 특정 세그먼트에 집중하며 훈련 과정에서 매개변수 수를 제한함으로써 이러한 문제를 해결합니다. 이로 인해 메모리 요구 사항이 낮아지고 작업 속도가 빨라져 텍스트-이미지 모델의 적응이 대폭 간소화됩니다.

LoRA 증류 방법은 텍스트 프롬프트로부터 이미지를 생성하는 Stable Diffusion 모델에 효과적으로 통합되었습니다. LoRA는 효율성과 적응 용이성 덕분에 스마트폰에 잘 적합한 것으로 평가됩니다. Qualcomm은 이 기술의 잠재력을 믿고 있으며, 경쟁업체인 MediaTek도 자사의 Dimensity 9300 칩에서 생성 AI 기능을 위해 이 접근 방식을 채택하고 있습니다.

MWC 2024에서 Qualcomm은 또한 삼성 Galaxy S24 Ultra에서 이미 제공되는 다양한 AI 기능을 선보이고 있습니다. 이러한 기능 중에는 생성 AI 기법을 사용한 이미지 캔버스 확장 및 AI 기반 비디오 생성과 같은 야심 찬 기술이 포함되어 있습니다. Qualcomm이 이러한 고급 기술을 스마트폰에 성공적으로 구현하는 모습을 보는 것도 흥미로울 것입니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles