El Instituto Allen para la IA presenta un LLM 'Verdaderamente de Código Abierto' para impulsar un 'Cambio Crítico' en el Desarrollo de la IA.

Home Noticias de IA El Instituto Allen para la IA presenta un LLM 'Verdaderamente de Código Abierto' para impulsar un 'Cambio Crítico' en el Desarrollo de la IA.

Updated on octubre 30 2024

El Allen Institute for AI (AI2), una organización sin fines de lucro fundada en 2014 por el fallecido cofundador de Microsoft, Paul Allen, ha presentado OLMo, un modelo de lenguaje grande de código abierto (LLM) que se describe como “verdaderamente de código abierto” y una alternativa “de última generación” a los modelos restrictivos y cerrados. Esta iniciativa marca un cambio significativo en el desarrollo de IA.

A diferencia de otros modelos que solo comparten código y pesos, OLMo ofrece recursos integrales, incluidos código de entrenamiento, datos de entrenamiento y herramientas asociadas, junto con herramientas de evaluación. Lanzado bajo una licencia aprobada por la Open Source Initiative, todos los componentes de OLMo, incluidos código, pesos y puntos de control intermedios, están disponibles bajo la Licencia Apache 2.0.

El anuncio llega en un momento crucial, ya que la IA de código abierto avanza rápidamente para alcanzar modelos propietarios como GPT-4 de OpenAI y Claude de Anthropic. Por ejemplo, el CEO de la startup parisina Mistral confirmó recientemente la aparición de un nuevo modelo de IA de código abierto que se acerca al rendimiento de GPT-4. Además, Meta lanzó recientemente una versión mejorada de su modelo de generación de código, Code Llama 70B, mientras se espera con anticipación la próxima iteración del Llama LLM.

Sin embargo, el sector de la IA de código abierto enfrenta críticas de algunos investigadores, reguladores y responsables políticos. Un controvertido artículo de opinión en IEEE Spectrum afirmaba que “la IA de código abierto es inherentemente peligrosa”.

El marco de OLMo promueve un enfoque “completamente abierto”, proporcionando acceso total a datos de preentrenamiento, código de entrenamiento, pesos del modelo y procesos de evaluación. Esto incluye código de inferencia, métricas de entrenamiento, registros de entrenamiento y un conjunto de evaluación de desarrollo que presenta más de 500 puntos de control para cada modelo, supervisados durante todo el proceso de entrenamiento bajo el proyecto Catwalk.

Los investigadores de AI2 planean mejorar continuamente OLMo introduciendo diferentes tamaños de modelos, modalidades, conjuntos de datos y capacidades. “Muchos modelos de lenguaje hoy en día carecen de transparencia”, afirmó Hanna Hajishirzi, líder del proyecto y directora sénior de Investigación en NLP en AI2. “Los investigadores no pueden comprender completamente el funcionamiento de un modelo sin acceso a los datos de entrenamiento. Nuestro marco empodera a los investigadores para estudiar científicamente los LLM, lo cual es esencial para desarrollar IA segura y confiable”.

Nathan Lambert, científico de ML en AI2, enfatizó que OLMo representa un nuevo paradigma en los LLM. “OLMo permite enfoques novedosos en la investigación y despliegue de ML, facilitando el desarrollo científico en cada etapa del proceso”, comentó.

La comunidad de IA de código abierto ha respondido entusiastamente al lanzamiento de OLMo. Jonathan Frankle, científico jefe en MosaicML y Databricks, lo calificó como “un gran salto para la ciencia abierta”. El CTO de Hugging Face también comentó en redes sociales que el modelo “está expandiendo los límites de la IA de código abierto”.

El científico jefe de Meta, Yann LeCun, destacó en el comunicado de prensa de AI2 que “los modelos fundacionales abiertos impulsan la innovación en la IA generativa, y una comunidad de código abierto vibrante es clave para moldear el futuro de la IA”.

Google Bard mejora la generación de imágenes y lanza Gemini Pro avanzado para competir con ChatGPT.

Coris asegura $3.7 millones para revolucionar la gestión de riesgos en pequeñas y medianas empresas con innovación en inteligencia artificial.

Most people like

Fluximg AI Image Generator

22.8K

Generador de Imágenes AI: Crea fácilmente imágenes impresionantes y de alta calidad a partir de descripciones de texto.

Generador de imágenes por IA AI Photo & Image Generator

PixCleaner

66.9K

PixCleaner es una herramienta gratuita en línea impulsada por inteligencia artificial, diseñada para eliminar fondos de imágenes de manera sencilla y mejorar tus fotos de productos. Con su interfaz fácil de usar, PixCleaner simplifica la edición de imágenes, asegurando que tus visuales se destaquen.

Otro AI Background Remover

TIKTOKEMOJI.COM

Desbloquea tu potencial creativo diseñando emojis únicos para TikTok. En esta guía, exploraremos cómo crear emojis expresivos que realcen tu contenido y capten la atención de tu audiencia. Ya sea para añadir un toque personal o para la identidad de tu marca, los emojis únicos pueden hacer que tus publicaciones de TikTok se destaquen. ¡Sumérgete con nosotros y descubre el arte de crear emojis para el éxito en las redes sociales!

TikTok AI Tiktok Assistant

CopyGenius

36.6K

Aprovecha el poder de la redacción impulsada por IA para elevar tu negocio de comercio electrónico. Descubre cómo la automatización inteligente puede generar descripciones de productos atractivas, contenido de marketing cautivador y mensajes personalizados para los clientes, todo pensado para aumentar la interacción y las ventas. ¡Explora hoy el impacto transformador de la IA en tu tienda en línea!

Inteligencia Artificial AI Content Generator

Find AI tools in YBX