Editor en La Ecuación Digital. Consultor de Innovación y Estrategia…
En el marco de IBM Think Madrid 2024 , Enric Delgado, director del equipo de client engineering de IBM, ofreció una presentación que resaltó la evolución en el uso de la inteligencia artificial (IA) y, específicamente, en la relación de las empresas con los modelos fundacionales.
La presentación se centró en la necesidad de pasar de una relación pasiva con estos modelos a una mucho más activa, utilizando como herramienta principal la plataforma InstructLab, desarrollada por IBM en colaboración con Red Hat.
La evolución de los modelos fundacionales y la necesidad de una interacción activa
En su intervención, Delgado destacó cómo, en los últimos dos años, se ha producido una proliferación masiva de modelos fundacionales, la tecnología subyacente en la IA generativa.
A pesar de la diversidad de estos modelos—desde los más generalistas hasta los más especializados—, Delgado criticó la tendencia de las empresas a adoptar una postura pasiva en su interacción con ellos, limitándose a evaluar y comparar estos modelos sin realmente involucrarse en su desarrollo o adaptación. Según él, esta actitud pasiva es ineficaz para generar avances significativos en el mundo de los negocios.
Delgado propuso un cambio de paradigma en la manera en que las empresas perciben y utilizan los modelos fundacionales, invitando a los asistentes a adoptar una postura más activa y participativa en la adaptación de estos modelos a sus propios datos y necesidades.
En su exposición, explicó que los modelos fundacionales no son más que representaciones sofisticadas de datos, comparándolos con las bases de datos relacionales que revolucionaron la capacidad de las empresas para manejar transacciones y analizar información en el pasado.
El verdadero potencial de estos modelos, según Delgado, reside en su capacidad para descubrir relaciones ocultas o no evidentes entre los datos, algo que es fundamental para las empresas que desean aprovechar al máximo sus propios conjuntos de datos.
InstructLab: Democratizando la personalización de modelos
En este contexto, Delgado presentó InstructLab, una innovadora plataforma que pretende democratizar el desarrollo y la personalización de grandes modelos de lenguaje (LLMs, por sus siglas en inglés). InstructLab permite a las empresas adaptar estos modelos a sus propios datos empresariales, sin necesidad de modificar el modelo base y sin perder las capacidades generales que este ofrece. Esto es crucial para empresas que buscan especializar un modelo en tareas específicas sin comprometer su aplicabilidad en otros contextos.
La plataforma InstructLab se basa en la metodología LAB (Large-Scale Alignment for ChatBots), desarrollada por IBM Research, que introduce un enfoque novedoso para la personalización colaborativa y la afinación de modelos de lenguaje. Esta metodología, que se apoya en la generación de datos sintéticos guiada por taxonomías, permite que los modelos aprendan nuevas habilidades y conocimientos sin olvidar lo ya aprendido. Esto se alinea con la forma en que los humanos aprendemos, incrementando conocimientos de manera acumulativa.
La estructura y funcionamiento de InstructLab
InstructLab se organiza en torno a varios componentes clave, siendo la taxonomía el núcleo central. Esta taxonomía actúa como un árbol de conocimiento que mapea tanto hechos como habilidades.
Por ejemplo, un hecho podría ser “el hombre llegó a la luna en 1969”, mientras que una habilidad podría ser “saber escribir prosa”. Este árbol de conocimiento permite una representación precisa y estructurada del conocimiento que posee un modelo en un momento dado.
Para integrar nuevos conocimientos en un modelo, InstructLab utiliza un proceso de dos etapas. Primero, se añaden los datos específicos de la empresa—como documentación o ejemplos prácticos—a la taxonomía. A continuación, un modelo denominado “modelo profesor” genera datos sintéticos adicionales basados en estos ejemplos, multiplicando así la cantidad de información disponible para entrenar al modelo base. Este proceso es crucial porque permite a las empresas enriquecer sus modelos sin necesidad de contar con un equipo técnico especializado, haciendo que el conocimiento pueda ser aportado directamente por expertos de negocio dentro de la organización.
Un aspecto destacado por Delgado fue la eficiencia de esta metodología. Como ejemplo, citó un proyecto interno de IBM en el que, utilizando InstructLab, lograron en una semana mejorar un asistente de COBOL más de lo que habían conseguido en nueve meses mediante iteraciones tradicionales de ajuste fino (fine tuning). Este enfoque no solo es más rápido, sino también más económico, dado que evita la necesidad de entrenar modelos desde cero, lo que representa un ahorro significativo en términos de recursos computacionales y tiempo.
La alianza estratégica y el modelo de despliegue con Red Hat
En su presentación, Delgado también subrayó la importancia de la colaboración entre IBM y Red Hat en el desarrollo de InstructLab. Esta alianza no solo ha permitido el desarrollo de la plataforma, sino que también ha facilitado la creación de un modelo de despliegue escalable en tres capas, adaptado a las diferentes necesidades y recursos de las empresas.
El modelo de despliegue comienza con una primera capa que está diseñada para organizaciones con recursos limitados, permitiendo la experimentación y la planificación de la implementación de modelos. La segunda capa se dirige a empresas con recursos más amplios, permitiéndoles construir modelos más robustos y colaborativos. Finalmente, la tercera capa permite integrar estos modelos en aplicaciones empresariales y en los mecanismos de gobierno de IA existentes, asegurando así un despliegue eficiente y seguro a escala.
Implicaciones para el futuro de la IA y la estrategia de IBM
Delgado concluyó su intervención reflexionando sobre la relevancia de la apertura y la colaboración en el desarrollo de la inteligencia artificial. Subrayó que el futuro de la IA pasa por un ecosistema abierto y transparente, donde tanto entidades públicas como privadas colaboren para avanzar en esta tecnología de manera segura y efectiva. Este compromiso se materializa en iniciativas como la AI Alliance, una organización cofundada por IBM y Meta que busca promover la innovación en IA bajo estos principios.
Además, Delgado anunció la próxima incorporación del Barcelona Supercomputing Center a la AI Alliance, un paso que refuerza la estrategia de IBM para potenciar la IA en España y desarrollar modelos lingüísticos fundacionales que incluyan tanto el español como las lenguas cooficiales del país.