
Editor en La Ecuación Digital. Consultor de Innovación y Estrategia…
IBM y la Agencia Espacial Europea (ESA) han lanzado TerraMind, un modelo fundacional de inteligencia artificial generativa de código abierto orientado al análisis de datos geoespaciales.
Diseñado para mejorar la comprensión de las dinámicas planetarias, TerraMind integra información procedente de múltiples fuentes de observación terrestre en una única arquitectura de IA entrenada en TerraMesh, el conjunto de datos geoespaciales más amplio desarrollado hasta la fecha. El modelo ha sido publicado en la plataforma Hugging Face para facilitar su acceso a investigadores y profesionales del sector.
TerraMind ha sido desarrollado en colaboración con KP Labs, el Centro de Supercomputación de Jülich (JSC) y la Agencia Espacial Alemana (DLR), en el marco de una iniciativa liderada por la ESA que tiene como objetivo ampliar la disponibilidad de modelos fundacionales entre la comunidad internacional dedicada a la observación de la Tierra.

Rendimiento y eficiencia en el análisis geoespacial
La arquitectura de TerraMind se basa en un codificador-decodificador de transformadores simétricos, lo que permite al modelo procesar entradas basadas en píxeles, tokens y secuencias, y correlacionar datos heterogéneos entre sí. A pesar de haber sido entrenado con 500.000 millones de tokens, su diseño ligero y eficiente permite realizar inferencias utilizando hasta diez veces menos recursos computacionales que los modelos convencionales por cada modalidad de entrada.
En una evaluación realizada por la ESA utilizando el conjunto de referencia PANGAEA, TerraMind superó en al menos un 8% a doce modelos de observación terrestre ampliamente utilizados, en tareas como clasificación de cobertura del suelo, detección de cambios, análisis multitemporal y monitoreo ambiental.
Datos globales y multimodales
El conjunto de datos utilizado para entrenar TerraMind comprende nueve millones de muestras distribuidas globalmente, alineadas espacio-temporalmente en nueve modalidades distintas. Estas incluyen imágenes de sensores satelitales, variables geomorfológicas, características de la superficie terrestre (como cobertura vegetal y uso del suelo), así como datos de localización y descripciones contextuales simples.
Esta diversidad permite aplicar el modelo a contextos geográficos y climáticos variados, minimizando sesgos regionales. Entre sus posibles aplicaciones destacan el análisis de riesgos relacionados con la escasez hídrica, donde la combinación de factores como el clima, la actividad agrícola y el uso del suelo es esencial para generar predicciones fiables.
Generación de datos sintéticos con “Thinking-in-Modalities”
Una de las características técnicas destacadas de TerraMind es su capacidad para generar datos de entrenamiento adicionales mediante un proceso conocido como Thinking-in-Modalities (TiM), una técnica que permite al modelo «razonar» entre diferentes tipos de datos. Esta metodología, inspirada en las cadenas de pensamiento de los modelos lingüísticos, permite mejorar su precisión en tareas específicas sin necesidad de entrenamiento adicional con datos externos.
El científico Johannes Jakubik, de IBM Research en Zúrich, ha explicado que “el ajuste TiM permite al modelo autogenerar información relevante, por ejemplo, al inferir la cubierta terrestre en contextos relacionados con cuerpos de agua, mejorando así su rendimiento sin necesidad de etiquetas adicionales”.
Aplicaciones especializadas y evolución del modelo
TerraMind se incorpora al ecosistema de modelos geoespaciales desarrollados por IBM, como Prithvi o Granite, utilizados en áreas como la agricultura de precisión, la gestión de infraestructuras críticas o la detección de desastres naturales. Estos modelos permiten combinar datos satelitales con algoritmos de aprendizaje automático para responder a eventos extremos y para la planificación territorial a medio y largo plazo.
Aunque modelos anteriores ya ofrecían capacidades relevantes en análisis satelital, su frecuencia de revisita —cada cinco días en promedio— limitaba su utilidad para el monitoreo de eventos de evolución rápida como inundaciones o incendios forestales. En respuesta a este desafío, TerraMind ha sido optimizado para procesar información heterogénea y generar estimaciones más precisas y actualizadas.
La infraestructura técnica utilizada para el entrenamiento del modelo proviene del Centro de Supercomputación de Jülich, que proporcionó capacidad de cálculo avanzada para el procesamiento de datos a gran escala. Otros socios del proyecto contribuyeron con experimentos de escalado y tareas de preparación de datos específicos.
Próximas etapas del proyecto
Las versiones especializadas de TerraMind para escenarios críticos, como la respuesta ante catástrofes, estarán disponibles próximamente en el repositorio IBM Granite. Estas versiones incluirán ajustes finos orientados a casos de uso específicos para instituciones públicas, comunidades y empresas. Según ha indicado la ESA, el objetivo es ampliar las capacidades predictivas de los modelos de observación de la Tierra, promoviendo su utilización en la toma de decisiones estratégicas.
Nicolas Longepe, científico de datos de observación terrestre de la ESA, ha subrayado la importancia de la colaboración interinstitucional: “La combinación del conocimiento en observación de la Tierra, aprendizaje automático y computación de alto rendimiento está transformando la forma en que analizamos los datos espaciales. Este tipo de iniciativas es esencial para aprovechar al máximo el potencial científico y operacional de los modelos de IA generativa”.
La validación del modelo también contó con la participación de expertos de la NASA, en el marco de la iniciativa Open Science, y su publicación en código abierto busca fomentar nuevas investigaciones y aplicaciones en el campo de las ciencias de la Tierra.