NVIDIA ha anunciado el lanzamiento de Isaac GR00T N1, el primer modelo base abierto y totalmente personalizable para dotar a robots humanoides de habilidades generalizadas y razonamiento. Este desarrollo forma parte de un nuevo conjunto de tecnologías que la compañía pone a disposición de la comunidad de desarrolladores de robótica, con el objetivo de facilitar y acelerar la creación de robots funcionales en sectores industriales afectados por la escasez global de mano de obra.
El modelo GR00T N1 se acompaña de nuevos marcos de simulación y generación de datos, como el Isaac GR00T Blueprint y Newton, un motor físico de código abierto desarrollado en colaboración con Google DeepMind y Disney Research. Esta infraestructura pretende reducir los costes de entrenamiento y aumentar la eficacia en la transferencia de habilidades humanas a robots mediante aprendizaje automático y datos sintéticos.
GR00T N1: arquitectura dual inspirada en la cognición humana
El núcleo del anuncio es GR00T N1, un modelo de base que combina dos sistemas interconectados, inspirados en el procesamiento cognitivo humano. El “Sistema 1” actúa con rapidez e intuición, similar a los reflejos, mientras que el “Sistema 2” opera de forma deliberada, analizando instrucciones y el entorno con un modelo de lenguaje visual para planificar acciones complejas.
Esta arquitectura permite que robots entrenados con GR00T N1 ejecuten tareas como manipular objetos, usar ambos brazos de manera coordinada o realizar secuencias de acciones que requieren razonamiento contextual. El modelo se entrena con datos de demostraciones humanas reales y millones de trayectorias sintéticas generadas con la plataforma Omniverse de NVIDIA.
GR00T N1 está diseñado para ser postentrenado con datos específicos, reales o sintéticos, permitiendo su aplicación a diferentes tipos de robots humanoides y tareas concretas. Durante la presentación en el evento GTC, se mostró su integración en el robot NEO Gamma de la empresa 1X Technologies, realizando tareas domésticas de forma autónoma.
Colaboraciones con fabricantes y adopción temprana
Diversas empresas del sector han tenido acceso anticipado al modelo, entre ellas Agility Robotics, Boston Dynamics, Mentee Robotics y NEURA Robotics. Estas colaboraciones buscan validar el modelo base en distintos entornos de uso y acelerar su aplicación comercial en ámbitos como la manipulación de materiales, embalaje o inspección.
Desde 1X Technologies, su consejero delegado, Bernt Børnich, afirmó que aunque su compañía desarrolla sus propios modelos, GR00T N1 ha representado una mejora significativa en razonamiento y ejecución, permitiendo un despliegue eficiente con cantidades mínimas de datos de entrenamiento adicionales.
Newton: motor físico optimizado para aprendizaje robótico
Otro eje de la nueva infraestructura es el motor de simulación física Newton, desarrollado por NVIDIA en colaboración con Google DeepMind y Disney Research. Este motor de código abierto se basa en la tecnología NVIDIA Warp y está diseñado para optimizar el aprendizaje físico de robots. Será compatible con marcos existentes como MuJoCo de Google DeepMind y Isaac Lab de NVIDIA.
Entre las novedades destaca el desarrollo conjunto de MuJoCo-Warp, una versión del simulador que puede acelerar cargas de trabajo de aprendizaje automático en robótica hasta 70 veces. Estará disponible a través de la biblioteca de código abierto MJX de DeepMind y mediante el propio motor Newton.
Disney Research utilizará Newton para mejorar sus plataformas de personajes robóticos, como los droides BDX inspirados en Star Wars, que participaron en la presentación en GTC. La compañía también trabaja con NVIDIA e Intrinsic en la creación de pipelines y prácticas comunes para la gestión de datos de robótica basados en el estándar OpenUSD.
Síntesis de datos para aprendizaje a gran escala
Uno de los desafíos principales en el entrenamiento de robots humanoides es la obtención de datos de calidad, ya que las demostraciones humanas reales están limitadas por el tiempo. Para resolver esta barrera, NVIDIA presentó el Isaac GR00T Blueprint, una herramienta para generar datos de manipulación sintéticos de forma masiva a partir de pocas demostraciones reales.
Con los primeros componentes del blueprint, la compañía generó 780.000 trayectorias sintéticas, el equivalente a 6.500 horas de demostración humana, en apenas 11 horas. La combinación de datos reales y sintéticos permitió mejorar el rendimiento de GR00T N1 en un 40% frente al entrenamiento solo con datos reales.
El modelo GR00T N1 y su conjunto de datos están ya disponibles en Hugging Face y GitHub, al igual que los recursos del blueprint de generación sintética. La plataforma build.nvidia.com permite acceder a una demostración interactiva.
Recursos disponibles para desarrolladores
Además del modelo y el motor de simulación, NVIDIA ha anunciado también el lanzamiento de DGX Spark, un sistema personal de computación de IA que facilita la expansión de capacidades del modelo GR00T N1 a nuevos entornos sin necesidad de programación extensiva.
El motor Newton está previsto para su publicación a lo largo del presente año. Por su parte, tanto el modelo base como los datos asociados ya pueden descargarse y utilizarse para tareas de entrenamiento personalizado, lo que posiciona este conjunto tecnológico como una infraestructura de referencia para el desarrollo de robótica humanoide.