Assembly AI presenta el modelo Universal-1, que cuenta con un 30% menos de alucinaciones en comparación con Whisper.

Home Noticias de IA Assembly AI presenta el modelo Universal-1, que cuenta con un 30% menos de alucinaciones en comparación con Whisper.

El proveedor de IA como servicio Assembly AI ha presentado su último modelo de reconocimiento de voz, Universal-1. Entrenado con más de 12.5 millones de horas de datos de audio multilingüe, Universal-1 logra una impresionante precisión de conversión de voz a texto en inglés, español, francés y alemán. La empresa asegura que Universal-1 reduce las alucinaciones en un 30% en datos de voz y en un 90% en ruido ambiental en comparación con el modelo Whisper Large-v3 de OpenAI.

En una entrada reciente de su blog, Assembly AI describió Universal-1 como un avance significativo en su objetivo de ofrecer capacidades de conversión de voz a texto precisas, confiables y robustas en múltiples idiomas. El modelo puede cambiar de idioma de manera efectiva, transcribiendo varios lenguajes dentro de un solo archivo de audio.

Universal-1 destaca en la estimación mejorada de marcas de tiempo, algo crucial para la edición de audio y video, así como para el análisis de conversaciones. Supera a su predecesor, Conformer-2, en un 13%, mostrando una mejor diarización de hablantes y una tasa de error de palabra por permutación mínima concatenada (cpWER) mejorada del 14%. Además, la precisión en la estimación del número de hablantes ha aumentado al 71%.

El modelo también cuenta con inferencia paralela optimizada, lo que reduce considerablemente el tiempo de procesamiento de archivos de audio largos. Universal-1 transcribe una hora de audio en solo 21 segundos en máquinas Nvidia Tesla T4, cinco veces más rápido que Whisper Large-v3, que tarda 107 segundos para realizar la misma tarea con un tamaño de lote menor.

Los modelos de IA para conversión de voz a texto mejorados ofrecen numerosos beneficios, como producir notas más precisas y confiables, identificar tareas y clasificar metadatos como nombres propios, identificación de hablantes y tiempos. Esta mejora beneficiará a diversas aplicaciones, desde la edición de video impulsada por IA hasta plataformas de telemedicina que requieren una entrada precisa de notas clínicas y envío de reclamaciones.

El modelo Universal-1 ya está disponible a través de la API de Assembly AI.

Los Desafíos de Crecimiento de Perplexity Generan Preocupaciones de SEO y Revelan Debilidades en la Dominancia de Google

El Generador de Imágenes de Meta Tiene Dificultades para Representar Parejas y Amistades Mixtas.

Most people like

Janitor AI

46.9M

Desata tu creatividad creando personajes de chatbot NSFW con diversas personalidades utilizando Janitor AI. Esta innovadora herramienta te permite diseñar chatbots únicos que dan vida a tus escenarios imaginativos, enriqueciendo tu experiencia narrativa. ¡Sumérgete en el mundo de la ficción interactiva y explora posibilidades infinitas!

Chatbots de IA AI Chatbot

Avaturn

127.4K

Crea fácilmente avatares realistas con Avaturn: ¡simplemente sube un selfie! Perfectos para mejorar juegos, aplicaciones o tu experiencia en el metaverso, estos avatares realistas son completamente exportables para todas tus necesidades digitales.

avatar AI Avatar Generator

Studdy AI

47.8K

Revoluciona tus sesiones de estudio con nuestro tutor de IA, diseñado para ofrecer asistencia instantánea con tus tareas. Obtén respuestas precisas, aclaraciones y orientación sobre tus trabajos, haciendo el aprendizaje más eficiente y atractivo. Ya sea que estés enfrentando problemas complejos de matemáticas o investigando temas de ciencias, nuestro tutor de IA está aquí para apoyarte en cada paso del camino. Experimenta el futuro de la educación con ayuda instantánea al alcance de tu mano.

Tutor de IA AI Education Assistant

magickimg

54.4K

Magickimg es una plataforma innovadora impulsada por inteligencia artificial que ofrece herramientas avanzadas de edición de imágenes, permitiendo a los usuarios mejorar y transformar sus visuales de manera sencilla.

Mejora de imágenes con IA Photo & Image Editor

Find AI tools in YBX