“모바일 AI의 새로운 시대.” 삼성은 다가오는 갤럭시 S24 스마트폰 시리즈를 이렇게 홍보하고 있습니다. 예정된 언팩 행사에서 회사는 “AI로 구동되는 완전히 새로운 모바일 경험”을 약속했습니다.
삼성이 AI의 열풍을 이용하는 것은 처음이 아닙니다. 스마트폰 프로세서의 주요 업체인 퀄컴과 미디어텍은 최근 자사의 최신 플래그십 및 중급 칩의 인상적인 온디바이스 생성 AI 기능을 선보였습니다. AI는 확실히 스마트폰 마케팅의 중심이 될 것입니다. 그러나 실제로 어떤 기대를 할 수 있을까요? 이른바 "AI 발전"의 부가 가치는 불확실하며, 단순히 기존 기능을 새로운 이름이나 앱으로 포장하는 것에 그칠 수도 있습니다.
갤럭시 S24 시리즈부터 퀄컴의 스냅드래곤 8 세대 3 칩이 탑재될 예정입니다. 이 칩 제조사는 텍스트 프롬프트로부터 이미지를 생성할 수 있는 생성 AI 기능에 대해 놀라운 주장을 하고 있습니다. 퀄컴은 이 기능이 스테이블 디퓨전 기술을 사용하여 1초 이내에 이미지를 생성할 수 있도록 최적화되었다고 설명했습니다. 동시에 미디어텍은 다성 9300이 스테이블 디퓨전을 통해 거의 즉각적인 텍스트-이미지 생성을 지원한다고 주장하고 있습니다. 흥미롭게도 이미 퀄컴의 최신 칩을 장착한 iQoo 12는 이러한 생성 AI 기능을 마케팅에서 언급하지 않고 있습니다.
삼성이 텍스트-이미지 생성을 제공한다고 가정할 경우, 이 기능은 궁극적으로 무엇을 이룰 수 있을까요? 이 기능이 타사 앱에 통합될지 아니면 삼성의 자체 앱에 통합될지 불확실합니다. 핵심 질문은 일상 스마트폰 사용에 어떤 개선을 가져올 수 있을까요? 일반적인 갤럭시 S24 사용자가 간단한 텍스트 프롬프트로 생성된 AI 이미지를 어떻게 활용할까요? 아마도 대화를 더욱 흥미롭게 하거나 소셜 미디어에서 화제를 일으키기 위해 사용할 것입니다.
하지만 복잡한 문제가 따릅니다. 사용자는 텍스트로부터 이미지를 생성한 후 이를 로컬에 저장하거나 클립보드에 복사하고, 마지막으로 선호하는 채팅 앱에 붙여 넣어야 합니다. 이상적인 솔루션은 삼성에서 이미지 생성을 키보드에 직접 통합하는 것입니다. 그러나 이 과정을 거칠 필요가 있을까요? 이미 이모지, GIF, 스티커가 비슷한 효과를 낼 수 있기 때문입니다. 또한 512 x 512 픽셀의 출력 해상도는 대학 과제나 작업 발표와 같은 용도로는 부족할 수 있습니다. 게다가 비용이 발생할 수도 있으며, 미디어텍의 시연에서는 프리미엄 옵션이 언급되었습니다. 갤럭시 S24 사용자는 텍스트-이미지 생성 토큰에 제한이 있어 정해진 한도를 초과하면 성능 저하나 구독료가 발생할 수 있습니다.
이런 경우 실용성에 대한 우려가 커집니다. OpenAI의 DALL-E와 같은 다른 솔루션이 쉽게 이용 가능하기 때문입니다. 사용자는 무료로 이미지를 생성하거나 ChatGPT Plus에 구독하여 최신 DALL-E 3 모델로 더 빠르고 품질 높은 생성이 가능합니다. 퀄컴은 스냅드래곤 8 세대 3이 “다중 모드 생성 AI 모델을 최초로 지원”한다고 주장하며, 네이티브 챗봇(메타의 라마 모델 기반)이 텍스트, 이미지, 음성을 통해 입력을 받아들일 것이라고 합니다. 그러나 이는 기존의 ChatGPT-4에서도 가능하며, 구독 요구가 있는 기능입니다.
퀄컴이 자랑하는 또 다른 흥미로운 기능은 AI 이미지 확장입니다. 사용자가 이미지 캔버스를 어떤 방향으로든 확장할 수 있으며, 생성 AI가 사용자 프롬프트에 기반하여 지능적으로 픽셀을 생성해 장면에 새로운 요소를 추가합니다. 이는 인상적인 기능일 수 있지만, 소중한 추억이 담긴 개인 사진을 수정할 경우 그 기억이 왜곡될 위험이 있습니다.
요약은 온디바이스 생성 AI의 또 다른 핵심 분야입니다. 이는 사용자가 최신 뉴스를 보다 쉽게 통합할 수 있도록 도와줄 수 있습니다. 그러나 사용 편의성에 따라 효율성이 좌우됩니다. 예를 들어, 뉴스 기사를 요약하는 데 다른 앱으로 전환할 필요가 없다면 경험이 크게 향상될 것입니다.
음성 기반 사진 편집과 같은 다른 제안된 기능은 편리해 보이지만, 현재의 원터치 필터와 같은 옵션들이 이미 빠르고 만족스러운 편집 경험을 제공하고 있기 때문에 그 진정한 가치를 평가하기 어렵습니다. 일반적인 채팅 응답 생성이나 인터넷 검색이 필요한 질문을 얻는 기본 기능으로 넘어가면 다시 어려움이 발생합니다.
메타의 라마와 같은 스마트폰 내에서 구동되는 생성 AI 모델은 자원의 한계로 인해 가장 정교하지 않습니다. 예를 들어 구글은 픽셀 8 프로에 기본 버전의 대형 언어 모델인 제미니 나노를 채택했습니다. 왜 더 높은 성능의 모델인 ChatGPT나 Pi를 전용 모바일 앱을 통해 활용하지 않을까요?
현재 생성 AI의 가장 실용적인 응용 프로그램은 클라우드 서비스에 대한 의존도를 줄여 오프라인 작업을 가능하게 하고 데이터 프라이버시를 향상시키는 것입니다. 이상적으로 이러한 온디바이스 도구는 Google Assistant, Alexa 또는 Siri와 원활하게 통합되어야 합니다. 예를 들어, AI 비서에게 아버지를 위한 고양이 이미지 모음집을 만들어 달라고 하거나, 가장 좋은 티켓 가격과 깔끔한 구글 캘린더 일정으로 디즈니랜드 여행을 계획하는 것이 가능합니다.
만약 온디바이스 생성 AI가 사용자 데이터를 로컬로 유지할 수 있다면, 데이터 프라이버시 환경을 조성할 수 있을 것입니다—이론상으로는 말이죠. 현재 삼성의 AI 기능에 대한 약속은 불확실합니다. 삼성의 의미 있는 생성 AI 경험이 실제로 구현될지, 아니면 그저 화려하지만 실용성이 떨어지는 기능들의 집합에 그칠지 지켜보는 것이 흥미롭습니다.