구글 I/O 2024를 앞두고 구글의 AI 발표에 대한 기대가 고조되었습니다. 행사 첫 순서로 유튜브 스타 마크 레빌렛이 목욕 가운을 입고 거대한 컵에서 등장하며 에너지 넘치는 공연을 펼쳤습니다. 그는 경쾌한 분위기를 조성하며 관객들에게 독창적인 음악 아이디어를 공유하라고 유도했고, 이러한 아이디어들은 구글의 AI DJ 소프트웨어를 통해 실제 음악으로 만들어졌습니다. 이 활기찬 시작은 인공지능에 대한 행사 주제를 암시했고, CEO 순다르 피차이는 "AI"라는 용어가 총 121회 언급되었다고 밝혔습니다. 사건이 끝날 무렵 두 가지 질문이 남았습니다: 구글은 최신 제품으로 우리 일상에 영향을 미치지 않는 문제를 해결하려 하고 있는가, 그리고 스마트폰이 놀라운 AI 기능을 자랑하는 가운데 수백 달러에 판매되는 전문 AI 하드웨어의 시장은 과연 존재하는가?
AI 기기 평가
현재 시장에는 Rabbit R1, Humane AI Pin, AI 기반 펜던트 등 흥미로운 AI 기기들이 있습니다. 이들 기기의 기능은 다양합니다. 일부는 듣고, 대화하며, 전화를 걸고, 영상을 기록하고, 주변 환경을 해석하는 대화형 AI 봇과 연결되기도 합니다. 하지만 이 기기들의 사용자 경험은 전반적으로 부족한 편입니다. 모바일 섹션 편집자 조 마링은 Rabbit R1을 자신이 겪어본 최악의 기기 중 하나로 평가했고, Humane AI Pin도 그리 나은 평가를 받지 못했습니다. 비록 이들이 1세대 기기이긴 하지만, OpenAI와 구글의 최근 통찰력으로 보면 그 미래는 불확실해 보입니다.
AI 인식의 진화
AI 기술은 특히 비전 기술 분야에서 크게 발전하고 있으며, 이는 AI가 카메라 렌즈를 통해 세상을 해석할 수 있게 합니다. 구글 I/O 2024에서 구글은 OpenAI의 GPT-4o, 즉 텍스트, 오디오, 비주얼을 처리하는 기능을 강화한 다중 모달 모델에 이어 Gemini Live를 선보였습니다. 두 제품 모두 사용자가 카메라를 아무 물체에나 지향하면 AI가 맥락 정보를 제공하는 방식으로 원활한 사용자 상호작용을 목표로 하고 있습니다. AI는 의복의 적합성을 판단하고, 물체를 번역하며, 잃어버린 물건을 찾는 데 도움을 줄 수 있습니다.
챗GPT와 Gemini Live의 경험은 다르지만, 두 제품 모두 기본적인 능력을 공유하고 있어 스마트폰에서의 AI와 전용 하드웨어 간의 격차가 분명해지는 중요한 순간입니다.
하드웨어의 도전
Rabbit R1과 Humane AI Pin은 각각 8MP와 12MP 카메라를 장착하고 있어 이미지 처리가 일부 가능하지만, 최신 스마트폰의 고급화된 안정화 카메라와는 경쟁할 수 없습니다. 일반 스마트폰은 고해상도 비주얼 입력을 제공하여 AI의 이해도를 높이고, 결과적으로 훨씬 더 선명한 출력을 생성합니다—이는 저가형 스마트폰과 플래그십 스마트폰의 영상 품질을 비교하는 것과 같습니다. 또한, 이러한 AI 기기는 중급 MediaTek 및 Qualcomm 칩으로 구동되며, 현대 스마트폰이 제공하는 컴퓨팅 파워가 부족하여 AI 작업을 훨씬 더 빠르게 처리할 수 없습니다. 기본적인 음성 비서가 요청을 훨씬 더 빠르게 처리할 수 있는 상황에서, 사용자들은 응답 대기 시간으로 15초 이상을 바라지 않습니다.
생성 AI는 크게 두 가지 방식으로 작동합니다: 클라우드 처리로 인터넷 연결이 필요한 경우와 오프라인 처리인 Google의 Gemini Nano가 탑재된 Pixel 8 및 일부 삼성 디바이스를 통한 경우입니다. 후자는 인터넷 없이도 AI가 작동할 수 있게 하지만, 현재 독립 실행형 AI 기기는 인터넷 없이 기능을 제공하지 않습니다.
온 디바이스 AI의 장점
온 디바이스 AI 기능을 통해 사용자는 Pixel폰에서 오디오 전사를 인터넷 없이도 활용할 수 있습니다. 구글의 신경망 기계 번역과 같은 기술들은 실시간 번역을 가능하게 하며, 올해 후반에 Gemini Nano가 다중 모달 처리를 지원하여 카메라와 마이크 입력을 기반으로 맥락에 맞는 응답을 제공할 것입니다. 이 접근 방식은 빠를 뿐만 아니라, 개인 정보가 온라인으로 전송되지 않고 디바이스에 남아 있어 데이터 보안도 향상됩니다. 또한, 생성 AI 기능의 제공 비용을 줄여, AI 혁명이 진행되는 가운데 소비자들의 경제성 우려도 해소할 수 있습니다.
Gemini의 구글 서비스와의 통합
구글의 서비스 스위트(Gmail, Docs, Drive, Maps, Photos, Search)와의 통합 중요성이 분명합니다. Gemini는 이러한 서비스와 일치하는 특정 작업을 위해 설계된 맞춤형 AI 어시스턴트를 제공합니다. 사용자는 Gemini를 이용해 여행을 계획하고, 관련 이메일에 접근하여 구글 검색과 통합된 데이터로 포괄적인 여행 일정을 작성할 수 있습니다. Gemini Advanced를 선택할 경우 대규모 PDF, 코드 및 멀티미디어 처리와 같은 능력이 추가로 제공되어 필수적인 통찰을 요약하고 전달합니다. Gemini는 앱 내에서 직접 작업을 향상시키며, 눈에 띄지 않으면서도 사용자에게 실시간으로 효과적으로 지원합니다.
전문 AI 기기보다 스마트폰을 선택하는 이유
AI 어시스턴트는 기능성과 편의성을 조화롭게 제공해야 하며, 관련 데이터를 활용해 개인 및 업무 작업을 향상시켜야 합니다. 현재 Rabbit R1과 Humane AI Pin과 같은 AI 기기는 이러한 약속을 충족하는 데 한계를 보이고 있습니다. 스마트폰은 뛰어난 AI 기술을 구동할 수 있는 능력을 갖추고 있으며, 전문 하드웨어의 단점을 피할 수 있는 만큼, 성능 면에서 우수한 휴대폰을 선택하는 것이 더 현명합니다. AI의 발전하는 시대에서 스마트폰은 선두주자로 자리매김하고 있으며, 독립 AI 기기의 필요성은 점점 줄어들고 있습니다.