Stability AI lanza el modelo 'Smol': Presentamos StableLM Zephyr 3B

Home Noticias de IA Stability AI lanza el modelo 'Smol': Presentamos StableLM Zephyr 3B

Updated on diciembre 7 2023

Stability AI ha ganado reconocimiento principalmente por su innovadora suite de modelos de IA generativa de texto a imagen, pero la compañía ahora está ampliando su oferta.

Hoy, Stability AI presentó su último avance: StableLM Zephyr 3B. Este modelo es un modelo de lenguaje grande (LLM) con 3 mil millones de parámetros, diseñado para diversas aplicaciones de chat, incluyendo generación de texto, resumen y personalización de contenido. StableLM Zephyr 3B es una versión optimizada y más pequeña del modelo de generación de texto StableLM presentado a principios de este año.

Una de las principales ventajas de StableLM Zephyr 3B es su tamaño. Al ser más pequeño que las versiones de 7 mil millones de parámetros de StableLM, permite despliegues en una gama más amplia de hardware con un menor consumo de recursos, todo mientras garantiza respuestas rápidas. El modelo ha sido optimizado específicamente para tareas de preguntas y respuestas e instrucciones.

“StableLM se entrenó durante más tiempo con datos de mayor calidad que los modelos anteriores, utilizando el doble de tokens en comparación con LLaMA v2 7b, y aún así iguala el rendimiento básico de ese modelo con solo el 40% del tamaño”, afirmó Emad Mostaque, CEO de Stability AI.

Presentación de StableLM Zephyr 3B

StableLM Zephyr 3B no es un modelo completamente nuevo, sino más bien una extensión del modelo existente StableLM 3B-4e1t. Su diseño se basa en el modelo Zephyr 7B de HuggingFace, que opera bajo una licencia MIT de código abierto y está destinado a ser utilizado como asistente. Zephyr utiliza un método de entrenamiento llamado Optimización de Preferencia Directa (DPO), que también se aplica en StableLM.

Mostaque explicó que DPO sirve como una alternativa a las técnicas de aprendizaje por refuerzo utilizadas en modelos anteriores, refinándolas para alinearse mejor con las preferencias humanas. Aunque DPO se ha aplicado generalmente a modelos más grandes, StableLM Zephyr marca una de las primeras instancias en que se utiliza eficazmente en un modelo de 3 mil millones de parámetros más pequeño.

Stability AI aprovechó DPO junto con el conjunto de datos UltraFeedback del grupo de investigación OpenBMB, que comprende más de 64,000 indicaciones y 256,000 respuestas. Esta combinación de DPO, el tamaño del modelo y el conjunto de datos de entrenamiento optimizado da como resultado métricas de rendimiento impresionantes. Por ejemplo, en la evaluación MT Bench, StableLM Zephyr 3B superó a modelos más grandes, incluyendo Llama-2-70b-chat de Meta y Claude-V1 de Anthropic.

Una Cartera en Expansión de Modelos

StableLM Zephyr 3B se suma a una creciente variedad de modelos lanzados por Stability AI mientras la startup de IA generativa busca mejorar continuamente sus capacidades. En agosto, la compañía presentó StableCode para el desarrollo de código de aplicaciones, seguido de Stable Audio en septiembre para la generación de texto a audio. En noviembre, se mostró una vista previa de Stable Video Diffusion, marcando la entrada de Stability AI en la generación de video.

A pesar de esta expansión, Stability AI sigue comprometida con sus raíces en la generación de texto a imagen. Recientemente, la compañía introdujo SDXL Turbo, una versión más rápida de su modelo insignia de difusión estable de texto a imagen, SDXL.

Mostaque enfatiza que aún queda mucho por innovar en Stability AI. “Creemos que los modelos pequeños, abiertos y de alto rendimiento, adaptados a los datos específicos de los usuarios, superarán a los modelos generales más grandes”, explicó. “Con el próximo lanzamiento completo de nuestros nuevos modelos StableLM, esperamos continuar democratizando los modelos de lenguaje generativos.”

Mine asegura una inversión de $30 millones para ofrecer soluciones de privacidad impulsadas por inteligencia artificial para empresas.

Cisco Abrace la IA para Potenciar su Estrategia de Ciberseguridad

Most people like

Dzine

La herramienta de diseño e imagen de IA más controlable

diseño gráfico Photo & Image Editor

Oscar Stories

25.2K

Transforma la hora de dormir en una experiencia mágica con Oscar Stories, la app impulsada por IA que crea historias personalizadas para niños. ¡Deja que la imaginación de tu hijo vuele con cuentos hechos a su medida!

Óscar AI Story Writing

Perplexity AI

72.3M

Descubre el poder de un motor de búsqueda impulsado por IA que aprovecha las capacidades de grandes modelos de lenguaje junto con motores de búsqueda tradicionales para obtener resultados mejorados.

Motor de búsqueda de IA AI Search Engine

AI poem generator

25.1K

Presentamos el Generador de Poesía AI Definitivo: ¡Tu herramienta esencial para crear hermosos poemas al instante! Ya seas un poeta en ciernes o simplemente busques expresar tus pensamientos de manera creativa, nuestro avanzado generador impulsado por IA está aquí para ayudarte a crear poesía impresionante con facilidad. ¡Explora las infinitas posibilidades del verso y deja volar tu imaginación!

Otro AI Blog Writer

Find AI tools in YBX