AI21 Lança o Jamba 1.5: Modelo Transformer Híbrido Aprimorado para Capacidades Avançadas de IA Agente

Home Notícias de IA AI21 Lança o Jamba 1.5: Modelo Transformer Híbrido Aprimorado para Capacidades Avançadas de IA Agente

Os transformers desempenham um papel essencial no panorama da IA generativa, mas não são o único método para o desenvolvimento de modelos. Hoje, a AI21 lançou novas iterações de seu modelo Jamba, integrando transformers com uma abordagem de modelo de Espaço de Estado Estruturado (SSM). As versões mini e grande do Jamba 1.5 aprimoram as inovações introduzidas na versão Jamba 1.0 em março. Utilizando um método SSM chamado Mamba, o Jamba visa unir os pontos fortes dos transformers e do SSM. O nome "Jamba" significa Atenção Conjunta e Arquitetura Mamba, prometendo desempenho e precisão superiores ao que cada modelo pode alcançar isoladamente.

"Recebemos um feedback incrível da comunidade; este foi o primeiro—e continua sendo um dos poucos—modelos em escala de produção baseados no Mamba", disse Or Dagan, VP de Produto da AI21. "Esta nova arquitetura gerou discussões sobre o futuro das arquiteturas de LLM e o papel dos transformers."

A série Jamba 1.5 introduz funcionalidades aprimoradas, incluindo chamada de funções, modo JSON, objetos de documentos estruturados e modo de citação. Essas adições posicionam os modelos como candidatos ideais para o desenvolvimento de sistemas de IA agentiva. Ambas as versões contam com uma janela de contexto substancial de 256K e utilizam uma arquitetura de Mistura de Especialistas (MoE), com o Jamba 1.5 mini oferecendo 52 bilhões de parâmetros totais (12 bilhões ativos) e o Jamba 1.5 grande exibindo 398 bilhões de parâmetros totais (94 bilhões ativos).

Estes modelos estão disponíveis sob uma licença aberta, com a AI21 oferecendo suporte e serviços comerciais. A empresa estabeleceu parcerias com AWS, Google Cloud, Microsoft Azure, Snowflake, Databricks e Nvidia.

Novas Funcionalidades do Jamba 1.5: Acelerando a IA Agentiva

Os modelos Jamba 1.5 Mini e Large apresentam várias novas capacidades voltadas para atender às crescentes demandas dos desenvolvedores de IA:

- Modo JSON para gerenciamento eficiente de dados estruturados

- Citações para aumentar a responsabilidade

- API de Documentos para melhor gerenciamento de contexto

- Capacidades de Chamada de Funções

Segundo Dagan, esses aprimoramentos são cruciais para desenvolvedores que avançam em sistemas de IA agentiva. O JSON (JavaScript Object Notation) é amplamente utilizado para criar fluxos de trabalho de aplicações, e sua inclusão facilita relações mais claras de entrada/saída em configurações complexas de IA, além do uso básico de modelos de linguagem. O recurso de citação funciona em conjunto com a nova API de documentos.

"Ensinamos o modelo a atribuir conteúdo relevante aos documentos fornecidos durante a geração", explicou Dagan.

Distinguindo o Modo de Citação do RAG

É importante diferenciar o modo de citação da Geração Aumentada por Recuperação (RAG), embora ambos busquem fundamentar as saídas da IA em dados confiáveis. Dagan esclareceu que o modo de citação do Jamba 1.5 é projetado para uma integração fluida com a API de documentos, oferecendo uma abordagem mais holística em comparação com o RAG tradicional. Em configurações padrão de RAG, os desenvolvedores conectam um modelo de linguagem a um banco de dados vetorial, exigindo que o modelo incorpore efetivamente os dados recuperados em suas saídas.

Em contraste, o modo de citação no Jamba 1.5 está intrinsecamente entrelaçado com o próprio modelo, permitindo que ele recupere, integre e cite explicitamente as fontes de informação utilizadas em suas saídas. Este recurso melhora a transparência e a rastreabilidade em comparação com fluxos de trabalho convencionais de LLM, onde o raciocínio do modelo pode ser menos claro.

A AI21 também suporta soluções RAG e fornece um serviço gerenciado de ponta a ponta que inclui recuperação e indexação de documentos.

Olhando para o futuro, Dagan destacou o compromisso da AI21 em evoluir seus modelos para atender às demandas dos clientes, com foco contínuo em avançar as capacidades de IA agentiva. "Reconhecemos a necessidade de inovar nos sistemas de IA agentiva, especialmente em relação ao planejamento e execução", afirmou.

Google Lança 'Prompt Gallery' Gratuito no AI Studio, Aprimorando Ferramentas para Desenvolvedores e Aumentando a Eficiência

Midjourney Lança Website para Todos os Usuários: Ganhe 25 Gerações de Imagens AI Grátis Hoje!

Most people like

SoundVerse AI

325.4K

Apresentamos uma plataforma de criação de áudio movida por IA que revoluciona a forma como você produz som. Com tecnologia de ponta ao seu alcance, você pode criar facilmente áudios de alta qualidade para diversas aplicações—seja para podcasts, músicas ou marketing. Liberte seu potencial criativo e simplifique seu processo de produção de áudio com nossas ferramentas inovadoras, projetadas para aprimorar tanto seu fluxo de trabalho quanto o resultado final. Experimente o futuro do áudio hoje!

IA AI Audio Enhancer

Vectra AI

148.6K

Apresentamos nossa plataforma de IA projetada para detecção e resposta a ameaças em tempo real. Com algoritmos avançados e capacidades de aprendizado de máquina, ela identifica rapidamente potenciais ameaças de segurança e possibilita respostas ágeis. Mantenha-se à frente das ameaças cibernéticas e proteja seus ativos digitais de forma eficaz com nossa tecnologia de ponta.

Cibersegurança AI Analytics Assistant

Resume Trick

123.9K

Crie seu currículo ideal sem esforço com nosso construtor de currículos online. Esta ferramenta fácil de usar simplifica o processo de criação, garantindo que você destaque suas habilidades e experiências de forma eficaz. Comece a fazer um currículo de destaque hoje mesmo!

Criador de currículos Cover Letter Generator

Air Fry AI

37.1K

Descubra o Air Fry AI, seu recurso ideal para instruções e receitas de fritadeira elétrica elaboradas com a ajuda da inteligência artificial.

fritadeira elétrica sem óleo AI Content Generator

Find AI tools in YBX