À medida que se aproxima o Google I/O 2024, a expectativa gira em torno dos possíveis anúncios de IA da Google. O evento começou com uma apresentação enérgica do youtuber Marc Rebillet, que fez uma entrada única saindo de uma xícara gigante, vestido com um roupão.
Com um tom animado, Rebillet convidou os participantes a compartilharem ideias musicais extravagantes, que ganharam vida com o software de DJ de IA da Google. Esse início vibrante antecipou o foco do evento em inteligência artificial, com o CEO Sundar Pichai mencionando o termo "IA" 121 vezes ao longo da programação.
Ao final do evento, duas questões ficaram no ar: Será que a Google está abordando questões que não impactam a vida cotidiana com suas novas ofertas? E há um mercado viável para hardware de IA especializado, com preços na casa das centenas, quando smartphones já oferecem capacidades de IA impressionantes?
Avaliação de Dispositivos de IA
Atualmente, o mercado apresenta gadgets de IA intrigantes, como o Rabbit R1 e o Humane AI Pin, além de pingentes com tecnologia semelhante. Suas funcionalidades variam: alguns ouvem, outros conversam, fazem chamadas, gravam vídeos e se conectam a bots de IA para interpretar o ambiente. Embora sejam dispositivos inovadores, a experiência do usuário tem sido abaixo das expectativas. O editor de seção mobile, Joe Maring, descreve o Rabbit R1 como um dos piores gadgets que já encontrou, e o Humane AI Pin não ficou muito atrás. Apesar de serem dispositivos de primeira geração, seu futuro é incerto, considerando as recentes inovações das gigantes de IA, como OpenAI e Google.
A Evolução da Conscientização sobre IA
As capacidades de IA estão avançando significativamente, especialmente na tecnologia de visão, que permite que a IA interprete o mundo por meio de uma lente de câmera. No Google I/O 2024, a Google apresentou o Gemini Live, seguindo o lançamento do GPT-4o pela OpenAI, um modelo omnimodal que aprimora a habilidade da IA em processar texto, áudio e imagens. Ambos os produtos visam interação fluida: aponte uma câmera para quase qualquer coisa e a IA fornece informações contextuais, como a adequação de roupas, tradução de objetos e localização de itens perdidos, como chaves de carro.
Enquanto as experiências com ChatGPT e Gemini Live são diferentes, ambas compartilham capacidades fundamentais. Este é um momento crucial em que a disparidade entre IA em smartphones e hardware dedicado se torna evidente.
O Desafio do Hardware
O Rabbit R1 e o Humane AI Pin têm câmeras de 8MP e 12MP, respectivamente, que permitem algum processamento de imagem. No entanto, não conseguem competir com as câmeras avançadas e estabilizadas dos smartphones modernos. Um smartphone comum aprimora a compreensão da IA ao fornecer entradas visuais de alta qualidade, resultando em uma saída muito mais clara—semelhante à comparação de qualidade de vídeo entre smartphones de baixo custo e modelos topo de linha.
Além disso, esses dispositivos de IA utilizam chips de média categoria da MediaTek e Qualcomm e carecem da capacidade de processamento oferecida pelos smartphones contemporâneos, que realizam tarefas de IA de forma significativamente mais rápida. Os usuários não querem esperar 15 segundos por uma resposta quando até um assistente de voz básico pode gerenciar pedidos muito mais rapidamente.
A IA generativa opera de duas maneiras principais: por meio de processamento em nuvem, que requer conexão com a internet, ou através de processamento offline, como o Gemini Nano no Pixel 8 e em alguns dispositivos Samsung. Este último permite que a IA funcione sem acesso à internet, mas atualmente, nenhum dispositivo de IA independente opera dessa forma.
As Vantagens da IA Local
Com as capacidades de IA local, os usuários podem utilizar funcionalidades como a transcrição de áudio em telefones Pixel sem precisar de conexão com a internet. Tecnologias como a Tradução Neural da Google permitem traduções em tempo real, e ainda este ano, o Gemini Nano com Multimodalidade possibilitará o processamento local para respostas contextuais com base em entradas de câmera e microfone.
Essa abordagem não só é mais rápida, mas também aumenta a segurança dos dados, pois as informações pessoais permanecem no dispositivo em vez de serem transmitidas online. Além disso, pode reduzir os custos associados à entrega de funcionalidades de IA generativa, respondendo a preocupações dos consumidores sobre acessibilidade em meio ao boom da IA.
Integração do Gemini com os Serviços da Google
A importância da integração é evidente no conjunto de serviços da Google, incluindo Gmail, Docs, Drive, Maps, Photos e Search. O Gemini oferece assistentes de IA personalizados projetados para tarefas específicas que se alinham a esses serviços. Os usuários podem interagir com o Gemini para planejar viagens, acessando e-mails relevantes e integrando esses dados ao Google Search para criar itinerários de viagem completos. Para aqueles que optarem pelo Gemini Advanced, capacidades ainda mais amplas estarão disponíveis, como o processamento de PDFs extensos, códigos e multimídia—resumindo e entregando insights essenciais.
O Gemini aprimora tarefas diretamente dentro dos aplicativos, permitindo que permaneça discreto enquanto ainda auxilia os usuários em tempo real.
A Preferência por Smartphones em Relação a Dispositivos de IA Dedicados
Um assistente de IA deve fornecer suporte prático, equilibrando funcionalidade e conveniência. Ele deve alavancar dados relevantes para aprimorar tarefas pessoais e profissionais sem incorrer em custos adicionais. Gadgets de IA atuais, como o Rabbit R1 e o Humane AI Pin, têm dificuldade em cumprir essa promessa devido às suas limitações. Dadas as capacidades avançadas dos smartphones—e sua habilidade de executar IA sofisticada sem as desvantagens do hardware especializado—investir em dispositivos inferiores parece imprudente quando os usuários podem contar com seus celulares para desempenho superior.
No cenário em evolução da IA, os smartphones estão liderando a mudança, tornando os dispositivos de IA independentes cada vez mais obsoletos.