La Revolución de la Evaluación GenAI de Galileo: Reducción del 97% en Costos y Mejora de Velocidad de 11 Veces

Galileo Transformará la Evaluación de IA con Luna: Un Cambio Radical para las Empresas

Galileo, líder en inteligencia artificial generativa para empresas, ha lanzado Galileo Luna, una suite revolucionaria de Modelos Fundamentales de Evaluación (EFMs) diseñada para transformar cómo las empresas evalúan sus sistemas de IA generativa. Luna aborda desafíos críticos—rapidez, costo y precisión—que han limitado previamente la adopción de la IA generativa en entornos productivos.

“Galileo creó Luna para superar las limitaciones de los métodos de evaluación de GenAI existentes, que a menudo son lentos, costosos e imprecisos,” afirmó Vikram Chatterji, Co-Fundador y CEO de Galileo. “Reconocimos la necesidad de evaluaciones de ultra baja latencia, costo efectivo y alta precisión en entornos productivos.”

Un Hito Importante en la Evaluación de IA

El lanzamiento de Luna representa un paso fundamental para Galileo, que ha estado a la vanguardia de la IA generativa para empresas desde principios de 2021. El compromiso de la compañía con la mejora de la evaluación de IA se evidencia en casi un año de rigurosa investigación y desarrollo que culminó en la creación de Luna.

Luna ha demostrado un rendimiento superior en una prueba de referencia, logrando un puntaje AUROC de 0.78, superando a competidores líderes como GPT-3.5, Trulens Groundedness y RAGAS Faithfulness.

Modelos Diseñados Específicamente para Redefinir Estándares de Evaluación

En el núcleo de la innovación de Luna se encuentran sus modelos de lenguaje pequeños, diseñados específicamente para tareas de evaluación como la detección de alucinaciones, la evaluación de calidad del contexto, la prevención de filtraciones de datos y la identificación de solicitudes maliciosas. Este enfoque especializado permite que Luna sobresalga en tres métricas clave: velocidad, costo y precisión.

“Al utilizar modelos de lenguaje pequeños adaptados, Luna logra evaluaciones que son un 97% más económicas y 11 veces más rápidas que las realizadas con GPT-3.5,” explicó Chatterji. Además, Luna supera los métodos anteriores en hasta un 20% en la detección de problemas como alucinaciones e información personal identificable (PII).

En un análisis de costos para evaluar 1 millón de consultas mensuales, Luna incurre en solo $175, lo que la hace considerablemente más económica que GPT-3.5 ($6,248), RAGAS Faithfulness ($7,994) y Trulens Groundedness ($16,641).

Innovación Sin Conjuntos de Datos Tradicionales

Una característica destacada de Luna es su capacidad para funcionar sin conjuntos de datos de verdad fundamental tradicionales. Al utilizar modelos de evaluación preentrenados refinados en diversos conjuntos de datos específicos de dominio, Luna simplifica el proceso de evaluación, eliminando la necesidad de conjuntos de pruebas personalizados que consumen tiempo.

Las aplicaciones potenciales de Luna son vastas. Chatterji señaló su eficacia en industrias que requieren alta confiabilidad, como la salud, las finanzas y las telecomunicaciones. “Luna es especialmente poderosa para aplicaciones empresariales a gran escala que procesan millones de consultas mensuales,” añadió.

Velocidad Inigualable y Mejora Continua

Galileo's Luna proporciona una velocidad excepcional, procesando una consulta individual en solo 0.232 segundos, una mejora significativa sobre competidores como GPT-3.5 (2.5 segundos) y RAGAS Faithfulness (5.4 segundos).

Los casos de uso para Luna incluyen desde el monitoreo en tiempo real de salidas de IA hasta garantizar la seguridad en las interacciones de chatbots. Con el producto Fine Tune de Galileo, Luna se puede personalizar para satisfacer las necesidades específicas de los clientes, logrando niveles de precisión del 95% o más en sectores críticos, incluidos farmacéuticos y servicios financieros.

A medida que evoluciona el panorama de la IA generativa, Galileo se mantiene dedicado a la innovación continua con Luna, enfocándose en expandir el soporte de tareas, mejorar la precisión y seguir reduciendo costos y latencia.

“Galileo está comprometido a avanzar en la evaluación de IA, ayudando a las organizaciones a implementar soluciones de IA confiables,” afirmó Chatterji. “A medida que la IA generativa continúa evolucionando, brindaremos a nuestros clientes capacidades de vanguardia que inspiren confianza entre los usuarios.”

Con el lanzamiento de Luna, Galileo ha fortalecido su posición como pionero en la evaluación de IA generativa para empresas. A medida que las compañías buscan aprovechar el potencial de la IA generativa, las evaluaciones rápidas, económicas y precisas de Luna serán fundamentales para impulsar la adopción generalizada de esta tecnología transformadora.

Most people like

Find AI tools in YBX