Смерть ИИ-гаджетов: Разбираемся, что пошло не так

В преддверии Google I/O 2024 ожидания росли вокруг вероятных анонсов AI от Google. Мероприятие началось с энергичного выступления звезды YouTube Марка Ребилье, который появиться из гигантской чашки в халате. Это задало позитивный тон, и Ребилье предложил зрителям поделиться дикими музыкальными идеями, которые были реализованы с помощью AI DJ-программного обеспечения Google. Этот живой старт предвещал акцент события на искусственном интеллекте, о чем CEO Сундар Пичаи отметил, что термин “AI” был упомянут 121 раз.

По мере завершения мероприятия возникли две основных вопросы: решает ли Google проблемы, которые не имеют значительного влияния на повседневную жизнь, и существует ли жизнеспособный рынок для специализированного AI-оборудования с ценой в несколько сотен долларов, когда смартфоны уже обладают невероятными AI-возможностями?

Оценка AI-устройств

На рынке сегодня представлены интересные AI-гаджеты, такие как Rabbit R1, Humane AI Pin и даже AI-устройства в форме кулонов. Их функциональность разнится: одни устройства слушают, другие разговаривают, делают звонки, записывают видео и взаимодействуют с говорящими AI-ботами для анализа окружения. Хотя эти устройства инновационны, их пользовательский опыт оставляет желать лучшего. Редактор мобильного раздела Джо Маринг описывает Rabbit R1 как один из худших гаджетов, которые он встречал, а Humane AI Pin не значительно лучше. Хотя это устройства первого поколения, их будущее кажется неопределенным с учетом последних данных от AI-гигантов OpenAI и Google.

Эволюция осведомленности о AI

Возможности AI значительно развиваются, особенно в области технологии зрения, позволяющей AI интерпретировать мир через камеру. На Google I/O 2024 Google представил Gemini Live, следуя за запуском OpenAI GPT-4o — универсальной модели, усиливающей возможности AI в обработке текста, аудио и визуалов. Оба продукта нацелены на бесшовное взаимодействие с пользователем: достаточно направить камеру на любой объект, и AI предоставит контекстную информацию. Он может оценить уместность одежды, переводить объекты и даже находить потерянные вещи, такие как ключи от машины.

Хотя опыт ChatGPT и Gemini Live различается, оба имеют общие базовые возможности. Это критический момент, когда становится очевидным различие между AI на смартфонах и специализированным оборудованием.

Проблема оборудования

Rabbit R1 и Humane AI Pin оснащены камерами на 8 МП и 12 МП соответственно, что позволяет осуществлять некоторую обработку изображений. Однако они не могут соперничать с современными смартфонами, обладающими продвинутыми стабилизированными камерами. Обычный смартфон усиливает понимание AI, предоставляя качественные визуальные данные, что приводит к гораздо более четкому выводу — подобно сравнению качества видео между бюджетными и флагманскими смартфонами.

Кроме того, эти AI-устройства работают на чипах среднего уровня от MediaTek и Qualcomm и не имеют вычислительной мощности современных смартфонов, которые могут выполнять AI-задачи значительно быстрее. Пользователи не хотят ждать 15 секунд ответа, когда даже базовый голосовой ассистент может справляться с запросами гораздо быстрее.

Генеративный AI функционирует двумя основными способами: через облачную обработку, требующую подключения к интернету, или оффлайн-обработку, как в случае с Gemini Nano на Pixel 8 и некоторых устройствах Samsung. Последний вариант позволяет AI работать без доступа к интернету, но в настоящий момент нет автономных AI-устройств, работающих без него.

Преимущества AI на устройстве

С возможностями AI на устройстве пользователи могут использовать функции, такие как транскрипция звука на телефонах Pixel, без необходимости подключения к интернету. Технологии, такие как Нейронный Машинный Перевод Google, позволяют получать переводы в реальном времени, а в конце этого года Gemini Nano с мультимодальностью позволит локальную обработку для контекстных ответов на основе визуального и звукового ввода.

Этот подход не только быстрее, но и улучшает безопасность данных, так как личная информация остается на устройстве, а не передается в сеть. Кроме того, он потенциально снижает затраты, связанные с предоставлением функций генеративного AI, что отвечает на потребительские опасения по поводу доступности в условиях роста AI.

Интеграция Gemini с сервисами Google

Значимость интеграции очевидна в целом продуктов Google, включая Gmail, Docs, Drive, Maps, Photos и Search. Gemini предлагает пользовательских AI-ассистентов, предназначенных для конкретных задач, связанных с этими сервисами. Пользователи могут сотрудничать с Gemini для планирования поездок, получая доступ к соответствующим электронным письмам и интегрируя эти данные с поиском Google для создания полных туристических маршрутов. Для пользователей, выбирающих Gemini Advanced, доступны еще более мощные функции, такие как обработка объемных PDF-файлов, кода и мультимедиа — сжимая и предоставляя важную информацию.

Gemini улучшает выполнение задач напрямую в приложениях, позволяя ему оставаться ненавязчивым при эффективной помощи пользователям в реальном времени.

Дело за смартфонами, а не отдельными AI-устройствами

AI-ассистент должен предоставлять практическую поддержку, находя баланс между функциональностью и удобством. Он должен использовать релевантные данные для улучшения личных и профессиональных задач без дополнительных затрат. Текущие AI-гаджеты, такие как Rabbit R1 и Humane AI Pin, испытывают трудности с выполнением этого обещания из-за своих ограничений. Учитывая продвинутые возможности смартфонов — и их способность запускать сложные AI без недостатков специализированного оборудования — инвестиции в второсортные устройства выглядят нецелесообразно, когда пользователи могут полагаться на свои телефоны для превосходной производительности.

В быстро меняющемся мире AI смартфоны ведут за собой, делая отдельные AI-устройства все более устаревшими.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles