A Qualcomm Busca Aprimorar Seu Celular Android com Ferramentas de IA Inovadoras

No Mobile World Congress 2024, a Qualcomm amplia seu portfólio de recursos de IA impulsionados pela série Snapdragon para dispositivos Android. A empresa já revelou recursos impressionantes de IA para seu smartphone Snapdragon 8 Gen 3, incluindo edição de mídia ativada por voz, geração de imagens no dispositivo com o Stable Diffusion e um assistente virtual avançado que utiliza modelos de linguagem em larga escala da Meta.

Hoje, a Qualcomm apresentou aprimoramentos para essas funcionalidades de IA. Um recurso destacado é o novo Assistente de Linguagem e Visão (LLaVa), projetado especificamente para smartphones. Essa ferramenta inovadora funciona como um chatbot, semelhante ao ChatGPT, mas integra as capacidades do Google Lens. Assim, a solução da Qualcomm pode processar tanto entradas de texto quanto imagens.

Por exemplo, é possível enviar uma foto de uma tábua de frios e perguntar sobre seu conteúdo. O assistente de IA, baseado em um modelo multimodal de grande escala (LMM) que processa mais de 7 bilhões de parâmetros, identificará diversas frutas, queijos, carnes e nozes presentes na imagem. Ele também pode lidar com perguntas adicionais, permitindo um fluxo de conversa natural. Embora o ChatGPT e produtos similares também tenham adicionado capacidades multimodais, eles dependem de uma arquitetura em nuvem, que envolve servidores remotos para processamento de dados. A abordagem da Qualcomm foca no processamento no dispositivo, garantindo respostas mais rápidas e maior privacidade, com risco mínimo de violação de dados. A Qualcomm enfatiza: “Esse LMM opera a uma taxa de token responsiva no dispositivo, resultando em maior privacidade, confiabilidade, personalização e eficiência de custos.” Os detalhes sobre se o assistente virtual baseado em LLaVa da Qualcomm será lançado como um aplicativo independente ou terá algum custo permanecem não confirmados.

O próximo grande anúncio da Qualcomm explora os aspectos criativos da geração e manipulação de imagens. Recentemente, a Qualcomm demonstrou a geração de texto para imagem mais rápida do mundo em um smartphone utilizando a tecnologia Stable Diffusion. Hoje, a empresa forneceu uma prévia da geração de imagens impulsionada pelo LoRA.

LoRA, ou Low-Rank Adaptation, é uma técnica inovadora desenvolvida pela Microsoft que oferece uma abordagem diferente para a geração de imagens em comparação com ferramentas tradicionais de IA generativa, como o DALL·E. Treinar modelos de IA pode ser custoso, demorado e exigir muito de hardware. O LoRA enfrenta esses desafios reduzindo significativamente o peso do modelo, concentrando-se em segmentos específicos e limitando o número de parâmetros durante o processo de treinamento. Isso resulta em menores requisitos de memória e operações mais rápidas, simplificando drasticamente a adaptação de modelos de texto para imagem.

O método de destilação LoRA foi eficazmente incorporado ao modelo Stable Diffusion para gerar imagens a partir de comandos de texto. Graças à sua eficiência e facilidade de adaptação, o LoRA é considerado bem apropriado para smartphones. A Qualcomm acredita em seu potencial, e até mesmo a concorrente MediaTek está adotando essa abordagem para recursos de IA generativa em seu chip topo de linha Dimensity 9300.

Na MWC 2024, a Qualcomm também apresenta uma variedade de recursos de IA, alguns dos quais já estão disponíveis no Samsung Galaxy S24 Ultra. Entre essas capacidades estão a possibilidade de expandir a tela de uma imagem usando preenchimento de IA generativa e geração de vídeos impulsionada por IA, que é particularmente ambiciosa. Será interessante ver como a Qualcomm implementa com sucesso essas tecnologias avançadas em smartphones.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles