En VB Transform 2024, David Cox de IBM destacó la importancia de la innovación abierta en la inteligencia artificial generativa empresarial, basándose en la dedicación de la compañía a las tecnologías de código abierto. Como vicepresidente de Modelos de IA y director del MIT-IBM Watson AI Lab, Cox presentó una visión que desafía e inspira al sector tecnológico.
"Lo que llamamos innovación abierta es, en realidad, la historia del progreso humano," afirmó Cox, subrayando que este concepto es crucial para el avance tecnológico. Resaltó la importancia del momento actual en el desarrollo de la IA: "Debemos tomar decisiones sobre dónde invertir y cómo evitar el bloqueo."
Cox cuestionó la percepción binaria de la apertura en la IA, afirmando: "Abierto no es solo una cosa; abarca muchos significados." Mencionó el ecosistema emergente de modelos abiertos de diversas fuentes, incluyendo gigantes tecnológicos, universidades e incluso gobiernos.
Sin embargo, expresó preocupaciones sobre la calidad de la apertura en muchos modelos de lenguaje de gran escala (LLMs). "En algunos casos, solo se te presenta un conjunto de números, sin que te des cuenta de cómo se produjo," advirtió. Esta falta de transparencia, argumentó, complica la reproducibilidad y socava principios esenciales del código abierto.
Cox estableció paralelismos con el software de código abierto tradicional, destacando características que han contribuido a su éxito: actualizaciones frecuentes, ciclos de lanzamiento estructurados, parches de seguridad y contribuciones activas de la comunidad. "Todo está bien definido, lo que permite contribuciones incrementales tanto de empresas como de la comunidad en general," comentó.
Criticó el estado actual de los LLMs abiertos, declarando: "A pesar de ser impresionantes, a menudo carecen de atributos fundamentales de código abierto." Señaló los calendarios de lanzamiento inconsistentes de algunos proveedores, donde los modelos a veces no reciben actualizaciones después de su lanzamiento inicial. Esta inconsistencia, según Cox, socava la verdadera esencia del código abierto y limita la innovación impulsada por la comunidad en IA.
Cox enfatizó el compromiso de IBM con la transparencia a través de su serie Granite de modelos de IA de código abierto. "Divulgamos todo sobre el modelo," afirmó, destacando que han abierto todo el código de procesamiento para garantizar la calidad y el filtrado de contenido objetable.
Sostuvo que este nivel de apertura no compromete el rendimiento. Presentó benchmarks mostrando que los modelos de Granite son de última generación, afirmando: "No tienes que sacrificar la transparencia por un rendimiento superior."
Ofreció una nueva perspectiva sobre los LLMs, considerándolos representaciones de datos más que simples herramientas de conversación. Con estimaciones que indican que los LLMs pronto abarcarán casi todos los datos disponibles públicamente, Cox notó una brecha significativa: el conocimiento propietario de las empresas está mayormente ausente en estos modelos.
Para abordar esto, propuso una misión para incorporar datos empresariales en modelos base y desbloquear su potencial completo. Aunque existen técnicas como la generación aumentada por recuperación (RAG), argumentó que a menudo no logran aprovechar el conocimiento único y la información propietaria de las empresas.
Cox delineó un enfoque en tres pasos para las empresas: identificar un modelo base abierto de confianza, crear una nueva representación de datos empresariales y luego implementar y escalar para la creación de valor. Subrayó la necesidad de transparencia al seleccionar un modelo base, especialmente en industrias reguladas, señalando que muchos proveedores de modelos no divulgan sus datos.
El desafío radica en fusionar eficazmente los datos propietarios con el modelo base. Cox argumentó que el modelo base elegido debe ser de alto rendimiento, transparente y de código abierto para proporcionar el control necesario y flexibilidad a las empresas.
Para hacer realidad su visión, Cox presentó InstructLab, una iniciativa conjunta entre IBM y Red Hat diseñada para integrar el conocimiento empresarial en modelos de IA. "InstructLab permite contribuciones genuinas de código abierto para LLMs," explicó.
El proyecto utiliza una taxonomía estructurada de conocimientos y habilidades del mundo, permitiendo a los usuarios mejorar el rendimiento del modelo de manera precisa. Este enfoque estructurado facilita la integración de insights específicos de la empresa, reduciendo las barreras para que expertos en el dominio personalicen los modelos.
InstructLab emplea un modelo "maestro" para generar datos de entrenamiento sintéticos, fusionando de manera fluida datos propietarios con modelos base sin sacrificar el rendimiento. Notablemente, acelera el ciclo de actualización del modelo a solo un día, en contraste con los tradicionales ciclos de lanzamiento prolongados.
Los análisis de Cox y el InstructLab de IBM indican un cambio en la adopción de la IA empresarial, pasando de modelos genéricos a soluciones personalizadas que reflejan la experiencia única de cada empresa. A medida que la tecnología evoluciona, la ventaja competitiva puede depender de convertir eficazmente el conocimiento institucional en insights impulsados por IA. El próximo capítulo de la IA no se trata solo de máquinas más inteligentes; se trata de máquinas que entienden los negocios tan íntimamente como lo hacen sus usuarios.