Desbloqueie o Poder do Google DataGemma AI: Seu Mágico de Estatísticas Definitivo

Home Notícias de IA Desbloqueie o Poder do Google DataGemma AI: Seu Mágico de Estatísticas Definitivo

Updated on setembro 12 2024

O Google está ampliando sua linha de modelos de IA para enfrentar desafios críticos na área. Hoje, a empresa apresentou o DataGemma, um conjunto de modelos de código aberto ajustados por instruções, projetados para reduzir as alucinações—onde modelos de linguagem extensos (LLMs) geram respostas imprecisas—especificamente em consultas estatísticas.

Disponíveis no Hugging Face para pesquisa e propósitos acadêmicos, esses novos modelos expandem a família Gemma existente, utilizando dados extensivos do mundo real da plataforma Data Commons do Google. Esta plataforma pública abriga um gráfico de conhecimento aberto que compreende mais de 240 bilhões de pontos de dados provenientes de organizações renomadas em diversos setores, incluindo economia, ciência e saúde.

Abordando Alucinações Fatuais

Os LLMs revolucionaram a tecnologia, impulsionando aplicações desde a geração de código até o suporte ao cliente e otimizando o uso de recursos para as empresas. Apesar de seus avanços, o problema das alucinações—especialmente relacionadas a dados numéricos e estatísticos—persiste.

De acordo com pesquisadores do Google, os fatores que contribuem para esse fenômeno incluem a natureza probabilística das saídas dos LLMs e a cobertura fatorial insuficiente nos dados de treinamento. As técnicas tradicionais de ancoragem têm enfrentado dificuldades com consultas estatísticas devido à variedade de esquemas e formatos em dados públicos, exigindo um contexto substancial para uma interpretação precisa.

Para fechar essas lacunas, os pesquisadores integraram o Data Commons, um dos maiores repositórios de dados estatísticos públicos normalizados, com a família de modelos de linguagem Gemma, criando o DataGemma.

Abordagens Inovadoras para Aumentar a Precisão

O DataGemma utiliza dois métodos distintos para melhorar a precisão fática:

1. Geração Intercalada de Recuperação (RIG): Esta abordagem integra a precisão factual comparando a saída original do LLM com estatísticas relevantes do Data Commons. O LLM refinado gera consultas em linguagem natural descritivas, que são convertidas em consultas estruturadas para recuperar respostas estatisticamente relevantes, incluindo citações.

2. Geração Aumentada por Recuperação (RAG): Este método melhora os modelos utilizando perguntas estatísticas originais para extrair variáveis relevantes e formar consultas em linguagem natural direcionadas ao Data Commons. Os dados extraídos, combinados com a pergunta original, são usados para acionar um LLM com longo contexto (neste caso, o Gemini 1.5 Pro) para a geração de respostas precisas.

Resultados Promissores em Testes

Em testes preliminares envolvendo 101 consultas, os modelos DataGemma ajustados com RIG melhoraram a precisão factual em 5-17% em relação à linha de base, alcançando cerca de 58% de precisão. Embora o RAG tenha produzido resultados ligeiramente inferiores, ainda superou os modelos de linha de base.

O DataGemma respondeu com sucesso a 24-29% das consultas utilizando respostas estatísticas do Data Commons, mantendo 99% de precisão com valores numéricos. No entanto, enfrentou desafios ao tirar inferências precisas dos números entre 6-20% das vezes.

Tanto as técnicas RIG quanto RAG demonstram eficácia em aumentar a precisão do modelo para consultas estatísticas, particularmente em contextos de pesquisa e tomada de decisões. O RIG oferece rapidez, enquanto o RAG fornece dados mais extensos, dependendo da disponibilidade de informações e das capacidades de gerenciamento de contexto amplo.

O Google pretende avançar na pesquisa sobre esses métodos por meio do lançamento público do DataGemma com RIG e RAG. A empresa declarou: "Nossa pesquisa está em andamento, e estamos comprometidos em refinar essas metodologias à medida que expandimos esse trabalho, garantindo testes rigorosos e integrando essa funcionalidade aprimorada tanto nos modelos Gemma quanto nos Gemini por meio de uma abordagem faseada de acesso limitado."

Entendendo os Novos Modelos o1-Preview e o1-Mini da OpenAI: Principais Insights para Desenvolvedores

Esqueça o GPT-5! A OpenAI apresenta a nova família de modelos de IA o1, com desempenho em nível de doutorado.

Most people like

STUDIO AI

475.6K

Descubra uma ferramenta de design web inovadora, impulsionada por tecnologia avançada, que converte seus designs em websites totalmente funcionais de forma simples.

Design de websites AI Website Builder

Nudify by FunFun.ai

619.1K

Transforme Sua Visão Criativa: Liberte uma Ferramenta de IA para Arte Nu Exquisita Descubra uma ferramenta de IA inovadora projetada para elevar sua arte, gerando arte nu de alta qualidade com facilidade. Esta tecnologia de ponta utiliza o poder da inteligência artificial para produzir imagens impressionantes e realistas que capturam a beleza da forma humana. Seja você um artista em busca de inspiração ou um designer à procura de visuais únicos, esta ferramenta oferece um recurso inigualável para criar representações elegantes e com bom gosto da arte nu.

Ferramenta de arte com IA AI Art Generator

Dittin AI

19.1K

Explore nossa plataforma inovadora de chat com personagens de IA, projetada para interações envolventes e seguras. Diferentemente de outras plataformas, priorizamos um ambiente familiar, garantindo que todas as discussões permaneçam livres de conteúdo impróprio. Junte-se a nós para uma experiência única onde você pode se conectar com personagens em um espaço protegido, ideal para usuários de todas as idades!

Chat de personagens de IA AI Chatbot

Checkstep

20.8K

Proteja Seus Usuários Contra Conteúdo Prejudicial No cenário digital atual, proteger seus usuários de conteúdo nocivo é mais crucial do que nunca. Com o aumento das interações online, o risco de exposição a material inapropriado ou perigoso também cresce. Ao implementar estratégias robustas de moderação de conteúdo, você não só protege seu público, mas também aprimora a experiência geral, construindo confiança e lealdade à sua plataforma. Priorize a segurança do usuário e crie um ambiente online seguro hoje mesmo.

Moderação de Conteúdo AI Detector

Find AI tools in YBX