Lanzamiento de la API de Stable Diffusion 3: ¡Prepárate para la próxima versión de Stable Assistant!

Después de solo dos meses en vista previa, Stability AI se complace en lanzar su modelo de IA generativa de próxima generación, Stable Diffusion 3, junto con una vista previa inicial de su innovadora tecnología de chatbot, llamada “Stable Assistant”.

Anunciado inicialmente en febrero, Stable Diffusion 3 ya está disponible a través de una API en la plataforma de desarrolladores de Stability AI. Esta API permite integrar fácilmente las potentes capacidades de generación de texto a imagen del modelo en diversos servicios y aplicaciones. Además, se ha introducido una variante turbo: Stable Diffusion 3 Turbo, que ofrece un rendimiento mejorado.

Con Stable Diffusion 3, Stability AI utiliza técnicas avanzadas de aprendizaje automático para mejorar significativamente la calidad de las imágenes y la tipografía. Un enfoque principal durante el lanzamiento de la API ha sido garantizar que el modelo esté listo para producción.

"Hemos implementado numerosas medidas de seguridad para evitar el uso indebido de SD3, refinando continuamente estas medidas según los comentarios de los usuarios", afirmó Christian Laforte, CTO y co-CEO interino de Stability AI.

Modelo Abierto Próximamente

Si bien Stable Diffusion 3 ya está disponible a través de la API, un modelo abierto aún no ha sido lanzado, pero está en camino. "Mejoraremos continuamente el modelo antes de su lanzamiento abierto", confirmó Laforte. "De acuerdo con nuestro compromiso con la IA generativa abierta, pronto haremos disponibles los pesos del modelo para autoalojamiento a través de una Membresía de Stability AI".

Esta estrategia de membresía, anunciada por primera vez en diciembre, tiene como objetivo establecer un nuevo modelo de ingresos para la empresa.

Socios de Fireworks Mejoran el Rendimiento de la API

La asociación de Stability AI con Fireworks AI mejorará el rendimiento de la API de Stable Diffusion 3. Optimizar la inferencia de la API para aplicaciones de IA generativa, especialmente a gran escala, puede ser complejo, pero la experiencia de Fireworks AI en compiladores de aprendizaje automático ayudará a abordar estos desafíos.

"Fireworks AI son expertos líderes en la industria en compiladores de ML, un componente vital para optimizar la velocidad de inferencia de nuestros modelos", señaló Laforte. "Asociarnos con ellos nos permite ofrecer la plataforma de API empresarial más rápida y confiable del mercado".

Innovaciones en Stable Diffusion 3

En el núcleo de Stable Diffusion se encuentra el modelo de difusión, con varias innovaciones que mejoran sus capacidades. Notablemente, la introducción de la arquitectura Multimodal Diffusion Transformer (MMDiT) mejora la comprensión del texto y la precisión tipográfica.

Para el modelo SD3-Turbo, que ofrece un rendimiento más rápido, se emplea un nuevo método llamado Latent Adversarial Diffusion Distillation (LADD). "Esencialmente, SD3-Turbo es hasta 10 veces más rápido que SD3 mientras produce imágenes de calidad casi igual", explicó Laforte.

Presentamos Stable Assistant

Además del nuevo modelo Stable Diffusion, Stability AI ha presentado una beta temprana de Stable Assistant, un chatbot impulsado por la tecnología de generación de texto e imagen de la empresa. Similar a la integración de ChatGPT Plus con DALL-E 3 de OpenAI, Stable Assistant permite la generación de imágenes a través de la conversación.

Laforte describe Stable Assistant como un chatbot fácil de usar que combina las capacidades de Stable Diffusion 3 y Stable LM 2 12B, que fue lanzado recientemente. Esta herramienta no solo genera imágenes a partir de conversaciones, sino que también proporciona respuestas informativas, ayuda en proyectos de escritura y enriquece el contenido con imágenes relevantes.

"Stable Assistant tiene como objetivo convertirse en nuestro chatbot multimodal, ofreciendo acceso a todos nuestros modelos y servicios de API sin necesidad de conocimientos técnicos", afirmó Laforte. "Planeamos seguir mejorando sus capacidades al agregar edición de imágenes e incorporando modelos de otras modalidades, incluyendo video, 3D, audio y código".

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles