La Revolución de la Evaluación GenAI de Galileo: Reducción del 97% en Costos y Mejora de Velocidad de 11 Veces

Home Noticias de IA La Revolución de la Evaluación GenAI de Galileo: Reducción del 97% en Costos y Mejora de Velocidad de 11 Veces

Galileo Transformará la Evaluación de IA con Luna: Un Cambio Radical para las Empresas

Galileo, líder en inteligencia artificial generativa para empresas, ha lanzado Galileo Luna, una suite revolucionaria de Modelos Fundamentales de Evaluación (EFMs) diseñada para transformar cómo las empresas evalúan sus sistemas de IA generativa. Luna aborda desafíos críticos—rapidez, costo y precisión—que han limitado previamente la adopción de la IA generativa en entornos productivos.

“Galileo creó Luna para superar las limitaciones de los métodos de evaluación de GenAI existentes, que a menudo son lentos, costosos e imprecisos,” afirmó Vikram Chatterji, Co-Fundador y CEO de Galileo. “Reconocimos la necesidad de evaluaciones de ultra baja latencia, costo efectivo y alta precisión en entornos productivos.”

Un Hito Importante en la Evaluación de IA

El lanzamiento de Luna representa un paso fundamental para Galileo, que ha estado a la vanguardia de la IA generativa para empresas desde principios de 2021. El compromiso de la compañía con la mejora de la evaluación de IA se evidencia en casi un año de rigurosa investigación y desarrollo que culminó en la creación de Luna.

Luna ha demostrado un rendimiento superior en una prueba de referencia, logrando un puntaje AUROC de 0.78, superando a competidores líderes como GPT-3.5, Trulens Groundedness y RAGAS Faithfulness.

Modelos Diseñados Específicamente para Redefinir Estándares de Evaluación

En el núcleo de la innovación de Luna se encuentran sus modelos de lenguaje pequeños, diseñados específicamente para tareas de evaluación como la detección de alucinaciones, la evaluación de calidad del contexto, la prevención de filtraciones de datos y la identificación de solicitudes maliciosas. Este enfoque especializado permite que Luna sobresalga en tres métricas clave: velocidad, costo y precisión.

“Al utilizar modelos de lenguaje pequeños adaptados, Luna logra evaluaciones que son un 97% más económicas y 11 veces más rápidas que las realizadas con GPT-3.5,” explicó Chatterji. Además, Luna supera los métodos anteriores en hasta un 20% en la detección de problemas como alucinaciones e información personal identificable (PII).

En un análisis de costos para evaluar 1 millón de consultas mensuales, Luna incurre en solo $175, lo que la hace considerablemente más económica que GPT-3.5 ($6,248), RAGAS Faithfulness ($7,994) y Trulens Groundedness ($16,641).

Innovación Sin Conjuntos de Datos Tradicionales

Una característica destacada de Luna es su capacidad para funcionar sin conjuntos de datos de verdad fundamental tradicionales. Al utilizar modelos de evaluación preentrenados refinados en diversos conjuntos de datos específicos de dominio, Luna simplifica el proceso de evaluación, eliminando la necesidad de conjuntos de pruebas personalizados que consumen tiempo.

Las aplicaciones potenciales de Luna son vastas. Chatterji señaló su eficacia en industrias que requieren alta confiabilidad, como la salud, las finanzas y las telecomunicaciones. “Luna es especialmente poderosa para aplicaciones empresariales a gran escala que procesan millones de consultas mensuales,” añadió.

Velocidad Inigualable y Mejora Continua

Galileo's Luna proporciona una velocidad excepcional, procesando una consulta individual en solo 0.232 segundos, una mejora significativa sobre competidores como GPT-3.5 (2.5 segundos) y RAGAS Faithfulness (5.4 segundos).

Los casos de uso para Luna incluyen desde el monitoreo en tiempo real de salidas de IA hasta garantizar la seguridad en las interacciones de chatbots. Con el producto Fine Tune de Galileo, Luna se puede personalizar para satisfacer las necesidades específicas de los clientes, logrando niveles de precisión del 95% o más en sectores críticos, incluidos farmacéuticos y servicios financieros.

A medida que evoluciona el panorama de la IA generativa, Galileo se mantiene dedicado a la innovación continua con Luna, enfocándose en expandir el soporte de tareas, mejorar la precisión y seguir reduciendo costos y latencia.

“Galileo está comprometido a avanzar en la evaluación de IA, ayudando a las organizaciones a implementar soluciones de IA confiables,” afirmó Chatterji. “A medida que la IA generativa continúa evolucionando, brindaremos a nuestros clientes capacidades de vanguardia que inspiren confianza entre los usuarios.”

Con el lanzamiento de Luna, Galileo ha fortalecido su posición como pionero en la evaluación de IA generativa para empresas. A medida que las compañías buscan aprovechar el potencial de la IA generativa, las evaluaciones rápidas, económicas y precisas de Luna serán fundamentales para impulsar la adopción generalizada de esta tecnología transformadora.

Zyphra Lanza Zyda: un Conjunto de Datos de Modelado de Lenguaje de 1.3T que Asegura Superar a Pile, C4 y arXiv

Adobe Aborda las Crecientes Preocupaciones sobre el Controversial Nuevo Lenguaje en los Términos de Servicio

Most people like

Pica AI Art Generator

2.3M

Pica AI Art Generator es una plataforma en línea fácil de usar, diseñada para crear impresionantes obras de arte generadas por inteligencia artificial. Transforma sin esfuerzo tus ideas en visuales cautivadores utilizando tecnología de inteligencia artificial de vanguardia.

arte de IA Text to Image

Be Your Best

44K

Mejora tu visión y tus habilidades de toma de decisiones. Lleva tu rendimiento al siguiente nivel.

mejora de la visión AI Coaching

Digitap AI Solutions

150.3K

En una era en la que la tecnología revoluciona industrias, las soluciones de IA están transformando de manera significativa los sectores bancario y de FinTech. Desde mejorar el servicio al cliente hasta optimizar la gestión de riesgos, la integración de la inteligencia artificial resulta esencial para las instituciones financieras que buscan innovación y eficiencia. Descubre cómo los procesos impulsados por IA no solo están simplificando las operaciones, sino que también están brindando experiencias personalizadas para los clientes, estableciendo las bases para una nueva era en las finanzas.

Plataforma de API impulsada por IA Other

Humanic Agentic PLG CRM

12K

Humanic PLG CRM es un software especializado diseñado exclusivamente para empresas de Crecimiento Guiado por el Producto (PLG). Permite a las empresas identificar, convertir y retener a sus usuarios más valiosos a través de una integración fluida con los sistemas de CRM orientados a ventas existentes. Esta solución innovadora mejora el compromiso de los usuarios y fomenta el crecimiento, convirtiéndola en una herramienta esencial para las estrategias PLG.

PLG CRM AI CRM Assistant

Find AI tools in YBX