Desbloqueando la Innovación Empresarial: 16 Ejemplos Reales de Utilización de LLM de Código Abierto

Los expertos en medios y tecnología afirman que los modelos de lenguaje grande (LLM) de código abierto podrían influir significativamente en la IA generativa dentro de las empresas, posiblemente más que los modelos propietarios como ChatGPT de OpenAI o las ofertas de Anthropic.

A pesar de la extensa experimentación y numerosos proyectos piloto con modelos de código abierto, las empresas establecidas han sido lentas en revelar sus aplicaciones en el mundo real. Para abordar esto, nos comunicamos con principales proveedores de LLM de código abierto, incluyendo Meta, Mistral AI, IBM, Hugging Face, Dell, Databricks, AWS y Microsoft. Nuestras consultas revelaron 16 casos notables de implementación (ver lista a continuación). Aunque este número es modesto, los analistas de la industria esperan un aumento en las aplicaciones de código abierto antes de que finalice este año.

Retrasos en la Adopción de LLM de Código Abierto

Una razón para la lenta adopción de modelos de código abierto es su reciente aparición. Meta lanzó el primer modelo significativo de código abierto, Llama, en febrero de 2023, tres meses después de que OpenAI presentó ChatGPT en noviembre de 2022. El modelo Mixtral de Mistral AI, el cual ha sido elogiado en varias evaluaciones, fue lanzado hace apenas un mes. Como resultado, las implementaciones del mundo real recién están comenzando a surgir. Los defensores del código abierto reconocen que actualmente los modelos cerrados predominan, pero prevén que esta brecha se estrechará.

Desafíos de los Modelos de Código Abierto

Existen limitaciones en los modelos de código abierto actuales. Amjad Masad, CEO de la startup de software Replit, señaló que el mecanismo de retroalimentación para el desarrollo de modelos es ineficaz debido a la dificultad para contribuir a mejoras. Sin embargo, muchos han subestimado el grado de experimentación entre los desarrolladores de código abierto, quienes han creado miles de modelos derivados, algunos de los cuales demuestran un rendimiento igual o superior a los modelos cerrados en tareas específicas, como FinGPT y BioBert.

El Valor Limitado de los Modelos Públicos Grandes para las Empresas

Según Matt Baker, SVP de Estrategia de IA en Dell, "los modelos públicos grandes tienen poco o ningún valor para las empresas privadas". Baker explicó que estos modelos tienden a ser demasiado generalizados y no facilitan la integración del dato privado de las empresas, que constituye alrededor del 95% del trabajo de IA realizado por las organizaciones. Como resultado, muchas empresas están explorando soluciones de código abierto para soporte al cliente y generación de código, utilizando código personalizado que a menudo es incompatible con LLMs de modelos cerrados genéricos.

Movimientos Lentos Debido a Consideraciones Empresariales

Andrew Jardine de Hugging Face mencionó que las empresas a menudo dudan en adoptar aplicaciones de LLM porque priorizan la privacidad de los datos, la experiencia del cliente y las implicaciones éticas. Las compañías generalmente pilotan casos de uso interno antes de expandirse a aplicaciones externas. Mientras que los modelos cerrados vieron implementaciones significativas hacia finales de 2023, se anticipa que las implementaciones de código abierto se acelerarán este año.

A pesar de las ventajas, algunas empresas encuentran que el código abierto es engorroso. Trabajar con APIs establecidas de proveedores como OpenAI a menudo se considera más simple que manejar cuestiones de licencia y gobernanza de modelos de código abierto.

Cruzando la Brecha entre Modelos Abiertos y Cerrados

Jardine enfatizó que la distinción entre modelos abiertos y cerrados se está difuminando. Por ejemplo, muchas empresas, incluida una gran farmacéutica, utilizan un LLM cerrado para tareas internas y un modelo de código abierto para funciones específicas como la identificación de información sensible. Esta elección refleja un deseo de mayor control sobre los datos.

El Caso para la Adopción de Código Abierto

A medida que los factores de adaptación de modelos y costos cambian rápidamente, es probable que las empresas busquen la flexibilidad de alternar entre modelos de código abierto y cerrados para mitigar riesgos. Las compañías a menudo optan por modelos de código abierto para mantener el control sobre datos sensibles mientras los adaptan para aplicaciones especializadas. Varias empresas, como Intuit y Perplexity, ya están desarrollando capas de orquestación de IA generativa que permiten la integración fluida de varios modelos para tareas específicas, sin importar su estatus abierto o cerrado. Aunque implementar modelos de código abierto a gran escala puede requerir más esfuerzo, pueden ofrecer ahorros a largo plazo, especialmente para organizaciones con infraestructura existente.

Muchas empresas utilizan discretamente modelos de código abierto. Por ejemplo, firmas automotrices y aerolíneas están experimentando con aplicaciones potenciadas por la plataforma lakehouse de Databricks, que incorpora LLM de código abierto.

Desafíos para Identificar Implementaciones de Código Abierto

Definir casos de uso genuinos en empresas puede ser complicado. Si bien muchos desarrolladores y startups crean aplicaciones utilizando LLM de código abierto, nuestro objetivo fue resaltar empresas establecidas con aplicaciones significativas. Definimos una empresa como aquella que tiene al menos 100 empleados y nos enfocamos en usuarios finales y no en proveedores de tecnología LLM.

Definir "código abierto" también presenta desafíos, como se observa con Llama de Meta, que tiene una licencia restringida. Además, si bien empresas como Writer han desarrollado sus propios LLM, solo ciertos modelos son de código abierto, dificultando la clasificación.

A continuación, se presentan ejemplos de implementaciones documentadas de LLM de código abierto en empresas:

1. VMWare: Utiliza el modelo StarCoder de Hugging Face para mejorar la generación de código en un entorno autoalojado, asegurando la seguridad del código propietario.

2. Brave: El navegador centrado en la privacidad emplea el modelo Mixtral 8x7B para su asistente conversacional, Leo.

3. Gab Wireless: Implementa modelos de Hugging Face para filtrar mensajes en pro de la seguridad de los niños, bloqueando contenido inapropiado.

4. Wells Fargo: Utiliza el modelo Llama 2 de Meta para diversas aplicaciones internas, mejorando los recursos para empleados.

5. IBM: Incorpora LLM de código abierto en su aplicación AskHR, que asiste a empleados con consultas relacionadas con recursos humanos y también se utiliza en nuevos servicios de consultoría.

6. Los Premios Grammy: Colabora con IBM en "AI Stories", utilizando Llama 2 para generar información y contenido personalizado para los aficionados.

7-9. Torneos Masters, Wimbledon, US Open: Aprovechan la tecnología de IBM para generar comentarios en tiempo real y resúmenes durante los eventos.

10. Perplexity: Startup enfocada en reinventar la búsqueda, utilizando LLM de código abierto para resumir respuestas en su motor de búsqueda.

11. CyberAgent: Emplea LLM de código abierto de Dell para modelado del idioma japonés adaptado a las necesidades del usuario.

12. Intuit: Combina sus propios LLM con modelos de código abierto para mejorar las capacidades de su función Intuit Assist.

13. Walmart: Desarrolla aplicaciones de IA conversacional, habiendo utilizado inicialmente el modelo BERT de código abierto de Google.

14. Shopify: Implementa Llama 2 en Sidekick, una herramienta de IA que agiliza tareas para propietarios de negocios de comercio electrónico.

15. LyRise: Startup de emparejamiento de talento que crea un chatbot para la contratación, utilizando Llama para interacciones.

16. Niantic: Usa Llama 2 para impulsar interacciones de personajes en el juego móvil Peridot.

A pesar de los desafíos existentes para definir y rastrear estas implementaciones, el interés en los LLM de código abierto está en aumento. A medida que más empresas exploren su potencial, anticipamos que el número de casos de uso públicos crecerá. Continuaremos actualizando esta lista a medida que surjan nuevas informaciones.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles