Amazon Web Services (AWS), que había sido vista como rezagada frente a sus competidores Microsoft Azure y Google Cloud en el ámbito de la inteligencia artificial generativa, está cambiando esta percepción. En la reciente conferencia AWS Re:Invent, Amazon destacó su compromiso de liderar el espacio de IA generativa para empresas mediante una serie de anuncios estratégicos.
Aspectos Clave de la Conferencia:
1. Ampliación de Opciones de LLM: AWS ha mejorado su servicio Bedrock para admitir más modelos, destacando Claude 2.1 de Anthropic, que cuenta con una impresionante ventana de contexto de 200K tokens y tasas de alucinaciones reducidas. Este movimiento subraya el compromiso de AWS de ofrecer modelos de lenguaje grande (LLMs) diversos más allá de la dependencia de Microsoft en OpenAI.
2. Embeddings Vectoriales Multimodales: Sivasubramanian presentó Titan Multi-modal Embeddings, que permite a los usuarios buscar y recuperar productos mediante texto e imágenes. Esta función mejora la experiencia del cliente en tiendas de muebles, por ejemplo, a través de la búsqueda visual.
3. Nuevos Modelos de Generación de Texto: AWS lanzó Titan TextLite y Titan TextExpress. TextLite sobresale en resumen y redacción, mientras que TextExpress se centra en la generación de texto abierto, atendiendo a diferentes necesidades empresariales.
4. Generador de Imágenes Titan: En modo de vista previa, esta herramienta genera imágenes realistas basadas en simples indicaciones, con marcas de agua invisibles para asegurar autenticidad. Sus avanzadas capacidades incluyen funciones de edición de imágenes como “outpainting,” que transforma fondos sin esfuerzo.
5. Generación Aumentada por Recuperación Simplificada (RAG): La nueva KnowledgeBase para Amazon Bedrock simplifica los procesos RAG al permitir que los usuarios apunten sus LLMs directamente a ubicaciones de datos, reduciendo significativamente la complejidad de configuración.
6. Herramientas de Evaluación de Modelos: AWS ahora ofrece una vista previa de la Evaluación de Modelos en Amazon Bedrock, permitiendo a las empresas comparar y seleccionar los modelos base adecuados a sus necesidades.
7. Aplicación de Agente DIY (RAG DIY): Esta innovadora aplicación permite a los usuarios ejecutar proyectos utilizando consultas en lenguaje natural. Sivasubramanian demostró cómo ayuda a los usuarios con planes de proyecto detallados y listas de productos.
8. Centro de Innovación en IA Generativa: AWS está mejorando su apoyo a las empresas ofreciendo orientación experta para construir modelos personalizados, particularmente en torno a los modelos Claude de Anthropic.
9. Sagemaker Hyperpod: Ahora disponible de manera general, Hyperpod optimiza el proceso de entrenamiento de modelos, reduciendo el tiempo en un 40% y facilitando la gestión de clústeres, permitiendo que las empresas se concentren en sus iniciativas de IA sin cargas técnicas.
10. Mejoras en la Integración de Bases de Datos: AWS está eliminando los silos entre sus bases de datos en la nube, permitiendo un acceso fluido para LLMs. Nuevas integraciones con Amazon OpenSearch y Amazon S3 permiten análisis de datos comprensivos sin necesidad de pipelines ETL.
11. Búsqueda Vectorial para DB en Memoria en Redis (Vista Previa): Esta función es ideal para industrias que necesitan búsquedas vectoriales rápidas, beneficiando significativamente a sectores como el financiero.
12. Integración de Neptune Analytics: Esto combina análisis vectorial y gráfico, ayudando a las empresas a descubrir información más profunda de sus datos interconectados hasta 80 veces más rápido.
13. Limpiezas para Modelos de ML Compartidos (Vista Previa): AWS permitirá a los clientes compartir datos de forma segura en limpiezas, facilitando el aprendizaje automático de terceros para análisis predictivos.
14. Amazon Q para SQL Generativo: Un asistente de IA diseñado para empresas, Amazon Q ahora puede traducir indicaciones en lenguaje natural a consultas SQL, maximizando la eficiencia del análisis de datos dentro de Amazon Redshift.
Estos anuncios subrayan el compromiso de AWS con la innovación en IA generativa, posicionándose como un competidor formidable en el paisaje de la nube y ofreciendo a las empresas una infraestructura robusta para sus proyectos de IA.