Hugging Face Lança Idefics2: O Novo Modelo de Linguagem Visual Open Source de 8B

Home Notícias de IA Hugging Face Lança Idefics2: O Novo Modelo de Linguagem Visual Open Source de 8B

A Hugging Face lançou seu modelo de linguagem visual Idefics em 2023, aproveitando a tecnologia desenvolvida inicialmente pela DeepMind. A versão aprimorada, Idefics2, já está disponível na Hugging Face e apresenta um tamanho de parâmetro menor, uma licença aberta e capacidades avançadas de Reconhecimento Óptico de Caracteres (OCR).

Idefics, que significa Decodificador Consciente de Imagem Aprimorado à la Flamingo com Atenções Cruzadas Intercaladas, é um modelo multimodal versátil capaz de processar tanto textos quanto imagens. Enquanto o Idefics original contava com 80 bilhões de parâmetros, o Idefics2 foi otimizado para apenas 8 bilhões, tornando-o comparável a modelos como DeepSeek-VL e LLaVA-NeXT-Mistral-7B.

As principais melhorias no Idefics2 incluem manipulação de imagens avançada, suportando resoluções nativas de até 980 x 980 pixels sem a necessidade de redimensionamento para caber em uma proporção quadrada fixa, uma limitação comum na visão computacional tradicional.

As capacidades de OCR do modelo também foram aprimoradas com a incorporação de dados provenientes da transcrição de textos em imagens e documentos. A equipe da Hugging Face melhorou a capacidade do Idefics2 de responder a questões relacionadas a gráficos, figuras e documentos.

Além disso, a arquitetura do Idefics2 foi simplificada, abandonando os mecanismos de atenção cruzada com controle utilizados em seu predecessor. Segundo a Hugging Face, “As imagens são inseridas no codificador de visão, seguidas por pooling aprendido do Perceiver e projeção de modalidade em um Perceptron de Múltiplas Camadas. Essa sequência agrupada é concatenada com as incorporações de texto para criar uma sequência intercalada de imagens e texto.”

Para treinar o Idefics2, a Hugging Face utilizou uma combinação de conjuntos de dados disponíveis publicamente, incluindo Mistral-7B-v0.1 e siglip-so400m-patch14-384. Dados adicionais de treinamento incluíram documentos da web, pares de imagem e legenda, dados de OCR e recursos de imagem para código.

O lançamento do Idefics2 ocorre em meio a um aumento de modelos multimodais no cenário de IA, incluindo o modelo Core da Reka, o Grok-1.5V da xAI e o Imagen 2 do Google.

Como as Colaborações da MongoDB com Startups de IA e Gigantes da Nuvem como AWS, Google e Microsoft Estão Impulsionando a Inovação em IA Generativa para Desenvolvedores

A API Verify da Telesign utiliza IA e ML para aumentar a segurança e impulsionar o crescimento omnicanal.

Most people like

ZeroGPT Plus

156.7K

Garanta a Autenticidade do Conteúdo com Tecnologia de IA Na era digital atual, verificar a autenticidade do conteúdo online é mais importante do que nunca. Com o aumento da desinformação e dos deepfakes, o uso da tecnologia de IA para checar a autenticidade do conteúdo tornou-se uma solução confiável e eficiente. Essa abordagem inovadora não apenas ajuda indivíduos e empresas a manterem sua credibilidade, mas também promove a confiança na comunicação online. Vamos explorar como aproveitar a IA pode transformar a verificação de conteúdo e assegurar a integridade das informações.

Verificador de Conteúdo de IA AI Detector

AI Bucket

17K

AI Bucket: Seu centro único para as melhores ferramentas de IA, reunindo de forma integrada a tecnologia de ponta para todas as suas necessidades.

Ferramentas de IA AI Tools Directory

NoowAI

46.1K

NoowAI é um assistente virtual gratuito que permite aos usuários conversar, fazer perguntas e receber ajuda sem a necessidade de criar uma conta. Além disso, possui uma Loja de Arte AI onde os usuários podem comprar obras de arte exclusivas.

assistente de IA AI Chatbot

AlphaResearch

19.3K

Bem-vindo à AlphaResearch, uma plataforma inovadora impulsionada por IA, projetada para investidores. Com nossa tecnologia, você pode explorar documentos empresariais de forma eficiente e descobrir insights valiosos para embasar suas decisões de investimento.

busca de empresas AI Search Engine

Find AI tools in YBX