Amazon Web Services (AWS), antes visto como atrasado em relação a seus concorrentes Microsoft Azure e Google Cloud no setor de IA generativa, está mudando a narrativa. Na recente conferência AWS Re:Invent, a Amazon destacou seu compromisso em liderar o espaço de IA generativa empresarial com uma série de anúncios estratégicos.
Destaques da Conferência:
1. Escolhas Expandida de LLM: O AWS melhorou seu serviço Bedrock para suportar mais modelos, notadamente o Claude 2.1 da Anthropic, que possui uma impressionante janela de contexto de 200K tokens e taxas reduzidas de alucinação. Este movimento enfatiza o compromisso da AWS em oferecer uma variedade de Modelos de Linguagem de Grande Escala (LLMs), além da dependência da Microsoft em relação ao OpenAI.
2. Embutidos Vetoriais Multi-Modais: Sivasubramanian apresentou os Embutidos Multi-modais Titan, permitindo que os usuários busquem e recuperem produtos utilizando texto e imagens. Esse recurso permite que varejistas, como lojas de móveis, melhorem a experiência do cliente ao combinar itens através de busca visual.
3. Novos Modelos de Geração de Texto: A AWS lançou Titan TextLite e Titan TextExpress. O TextLite se destaca em sumarização e redação, enquanto o TextExpress foca na geração de texto aberto, atendendo a diferentes necessidades empresariais.
4. Gerador de Imagens Titan: Em modo de pré-visualização, essa ferramenta gera imagens realistas com base em prompts simples, acompanhadas de marcas d'água invisíveis para autenticidade. Suas capacidades avançadas, apresentadas durante a palestra, incluem recursos de edição de imagem como "outpainting", transformando fundos de maneira fluida.
5. Geração Aumentada de Recuperação (RAG) Simplificada: A introdução do KnowledgeBase para Amazon Bedrock simplifica os processos RAG, permitindo que os usuários direcionem seus LLMs diretamente para locais de dados, reduzindo significativamente a complexidade de configuração.
6. Ferramentas de Avaliação de Modelos: A AWS agora oferece uma pré-visualização da Avaliação de Modelos no Amazon Bedrock, permitindo que as empresas comparem e escolham os modelos de base mais adequados às suas necessidades.
7. App DIY Agent (RAG DIY): Este aplicativo inovador permite que os usuários realizem projetos usando consultas em linguagem natural. Sivasubramanian demonstrou como ele auxilia os usuários com planos de projeto detalhados e listas de produtos.
8. Centro de Inovação em IA Gen: A AWS está aprimorando seu suporte às empresas ao oferecer orientação especializada na construção de modelos personalizados, especialmente em relação aos modelos Claude da Anthropic.
9. Sagemaker Hyperpod: Agora disponível para todos, o Hyperpod agiliza o processo de treinamento de modelos, reduzindo o tempo em até 40% e facilitando a gestão de clusters, garantindo que as empresas se concentrem em suas iniciativas de IA sem encargos técnicos.
10. Melhorias na Integração de Banco de Dados: A AWS está eliminando silos entre seus bancos de dados em nuvem, permitindo acesso contínuo para LLMs. Novas integrações com Amazon OpenSearch e Amazon S3 possibilitam análises abrangentes de dados sem a necessidade de pipelines ETL.
11. Busca Vetorial para Banco de Dados em Memória no Redis (Pré-visualização): Este recurso atende indústrias que necessitam de buscas vetoriais rápidas, beneficiando significativamente setores como finanças.
12. Integração de Análise Neptune: Isso combina análises vetoriais e de grafo, ajudando as empresas a descobrirem insights mais profundos de seus dados interconectados até 80 vezes mais rápido.
13. Salas Limpa para Modelos de ML Compartilhados (Pré-visualização): A AWS permitirá que os clientes compartilhem dados de maneira segura em salas limpas, facilitando o aprendizado de máquina de terceiros para análises preditivas.
14. Amazon Q para SQL Generativo: Um assistente de IA voltado para negócios, o Amazon Q agora pode traduzir prompts em linguagem natural em consultas SQL, maximizando a eficiência da análise de dados dentro do Amazon Redshift.
Esses anúncios ressaltam o compromisso da AWS com a inovação em IA generativa, posicionando-se como um competidor formidável no cenário de nuvem e oferecendo às empresas uma infraestrutura robusta para seus projetos de IA.