En un periodo más tranquilo para OpenAI, su competidor Anthropic ha generado interés con el lanzamiento de su familia de modelos de lenguaje grande, Claude 3. Otro jugador a seguir en el espacio de la inteligencia artificial generativa es la startup israelí Deci, que recientemente anunció actualizaciones significativas en sus productos.
En otoño de 2023, Deci lanzó los modelos de código abierto DeciDiffusion y DeciLM 6B, versiones ajustadas de Stable Diffusion 1.5 de Stability y LLaMA 2 7B de Meta. Desde entonces, la compañía ha presentado DeciCoder, un modelo de lenguaje para completar código, y la versión mejorada DeciDiffusion 2.0. Ahora, Deci ha revelado Deci-Nano, un modelo de lenguaje cerrado, más pequeño y eficiente, disponible únicamente a través de la Plataforma de Desarrollo de IA Generativa de Deci, dirigida a empresas y desarrolladores.
¿Un Cambio hacia lo Comercial?
Parece que Deci se está moviendo hacia una estrategia más comercial, similar a la asociación de Mistral con Microsoft. Esto plantea interrogantes sobre el futuro de la IA de código abierto. Rachel Salkin, VP de Marketing de Deci, comentó por correo electrónico: “Estamos comprometidos a apoyar a la comunidad de código abierto, pero también reconocemos el valor de los modelos cerrados que mejoran la precisión y velocidad, brindando mayor valor a nuestros clientes”. Salkin destacó varios modelos de código abierto lanzados recientemente—incluyendo DeciLM-6B, DeciLM-7B y DeciCoder—que continúan registrando descargas significativas, a pesar de que sus espacios de demostración han sido temporalmente pausados.
Rendimiento a un Precio Competitivo
Si Deci realmente está optando por un camino comercial, Deci-Nano representa un primer paso indicativo. Este modelo destaca en comprensión del lenguaje y razonamiento, logrando 256 tokens en solo 4.56 segundos en GPUs NVIDIA A100. El blog de Deci enfatiza que Deci-Nano supera a modelos como Mistral's 7B-Instruct y el Gemma 7B de Google, siendo excepcionalmente asequible a $0.10 por millón de tokens de entrada, en comparación con $0.50 de GPT-3.5 Turbo de OpenAI y $0.25 de Claude 3 Haiku.
“Deci-Nano encarna nuestro enfoque orientado a la producción, centrado en calidad y rentabilidad”, declaró Yonatan Geifman, cofundador y CEO de Deci. Este modelo de ventana de contexto de 8K fue desarrollado con la tecnología AutoNAC de Deci, diseñada para optimizar la eficiencia del modelo generando modelos más pequeños que replican de cerca la funcionalidad de los más grandes. Desde análisis financiero hasta creación de contenido, Deci-Nano tiene como objetivo empoderar a las empresas para innovar mientras gestionan costos de manera efectiva.
Deci también ofrece opciones de implementación flexibles, proporcionando instancias sin servidor para escalabilidad o instancias dedicadas para mayor privacidad y personalización. Esta versatilidad permite a las empresas adaptar sus soluciones de IA según las necesidades cambiantes sin sacrificar rendimiento.
Lanzamiento de una Plataforma Integral
A pesar de que gran parte de las noticias recientes se centra en Deci-Nano, la introducción de una Plataforma de IA Generativa completa representa un avance significativo. Esta plataforma se describe como una “solución integral” adaptada a las necesidades de eficiencia y privacidad de las empresas.
¿Qué incluye? Según Deci, los usuarios accederán a LLMs ajustables, un motor de inferencia y una solución de gestión de clústeres de inferencia de IA. Deci-Nano es el primer modelo propietario disponible a través de esta plataforma, con planes para más modelos—algunos abiertos, otros cerrados—en el horizonte.
El motor de inferencia permite a los usuarios implementar Deci-Nano según sus necesidades, ya sea a través de la API de Deci, en su nube privada virtual o en sus instalaciones. Para los clientes que gestionan sus propias nubes privadas virtuales, Deci proporcionará un modelo contenedor, junto con servicios de inferencia gestionados en su clúster de Kubernetes.
Además, la Plataforma de IA Generativa ofrece opciones de implementación en las instalaciones para empresas que deseen mantener los datos internos. Los clientes recibirán un contenedor virtual que alberga Deci-Nano y el kit de desarrollo de software Infery de Deci, permitiendo la integración en sus aplicaciones.
Los detalles de precios de la Plataforma de IA Generativa de Deci y sus diversas ofertas aún no se han divulgado, pero se proporcionarán actualizaciones conforme se disponga de información.