Editor en La Ecuación Digital. Consultor de Innovación y Estrategia…
NVIDIA lanzó hoy Cosmos™ , una plataforma innovadora diseñada para acelerar el desarrollo de la IA Física. Compuesta por modelos generativos de última generación, tokenizadores avanzados y un pipeline acelerado de procesamiento de datos, Cosmos está especialmente optimizada para crear sistemas como robots y vehículos autónomos. Este anuncio marca un hito en la integración de la inteligencia artificial en el mundo físico.
La IA Física y su importancia en la innovación
La IA Física busca dotar a las máquinas de la capacidad de comprender y actuar en el mundo real, integrando conceptos como la permanencia de objetos, las interacciones físicas y las dinámicas del entorno. Jensen Huang, fundador y CEO de NVIDIA, describió Cosmos como un catalizador que democratiza esta tecnología: “El momento ChatGPT para la robótica está cerca. Los modelos fundacionales son esenciales para avanzar en el desarrollo de robots y vehículos autónomos, pero no todos los desarrolladores tienen los recursos para entrenarlos desde cero. Cosmos facilita este proceso”.
Componentes de NVIDIA Cosmos
La plataforma está diseñada para superar los retos asociados al desarrollo de la IA Física, como el alto coste y la necesidad de grandes volúmenes de datos del mundo real. Cosmos ofrece herramientas clave para entrenar y personalizar modelos de IA física de forma eficiente:
- Modelos fundacionales abiertos: Generan datos sintéticos realistas basados en texto, imágenes, videos y datos de sensores robóticos. Estos modelos permiten crear entornos como fábricas, almacenes o carreteras con diversas condiciones climáticas y de tráfico.
- Tokenizador de video Cosmos: Convierte imágenes y videos en tokens con una compresión 8 veces mayor y un procesamiento 12 veces más rápido que los tokenizadores actuales.
- Pipeline acelerado: Con tecnología NVIDIA AI y CUDA, procesa 20 millones de horas de video en solo 14 días usando la plataforma Blackwell, en comparación con los más de tres años que requeriría un pipeline basado en CPU.
Aplicaciones prácticas de Cosmos
NVIDIA Cosmos está diseñado para abordar las necesidades de industrias como la robótica, la automoción y la logística. Algunas de sus aplicaciones destacadas incluyen:
- Generación de datos sintéticos: Creación de videos fotorealistas basados en escenarios controlados desarrollados en NVIDIA Omniverse™, como entornos de conducción o procesos industriales.
- Simulación de futuros posibles: Cosmos puede generar múltiples resultados simulados, ayudando a los modelos de IA a seleccionar las decisiones más óptimas.
- Desarrollo y evaluación de modelos físicos: Personalización y mejora de modelos mediante aprendizaje por refuerzo y simulaciones avanzadas.
- Búsqueda y análisis de video: Identificación de escenarios específicos, como condiciones de carretera con nieve o congestión en almacenes, para entrenar sistemas autónomos.
Adopción temprana por líderes de la industria
NVIDIA Cosmos ya está siendo utilizado por pioneros de la IA Física. Empresas como Uber, XPENG, Agile Robots y Waabi han adoptado la plataforma para acelerar el desarrollo de sus sistemas autónomos y robóticos:
- Uber: Está colaborando con NVIDIA para combinar los datos de conducción de su flota con las capacidades de Cosmos, mejorando la eficiencia en la creación de modelos avanzados para vehículos autónomos.
- Waabi: Utiliza Cosmos para optimizar la curación de datos en sus sistemas de software para vehículos autónomos.
- XPENG: Emplea Cosmos en el desarrollo de sus robots humanoides.
Compromiso con la IA confiable y segura
NVIDIA Cosmos incluye herramientas para garantizar el desarrollo responsable de la IA. Los modelos generados integran marcas de agua invisibles para identificar contenido creado por IA, reduciendo riesgos de desinformación. Además, la plataforma sigue los principios de IA confiable de NVIDIA, priorizando la privacidad, la seguridad y la transparencia.
Disponibilidad
Los modelos fundacionales de Cosmos están disponibles bajo licencia abierta en Hugging Face y el catálogo de NVIDIA NGC. Próximamente, estarán disponibles como microservicios optimizados de NVIDIA NIM. Los desarrolladores también pueden acceder a NVIDIA NeMo Curator para personalizar sus propios modelos y desplegarlos mediante NVIDIA DGX Cloud con soporte empresarial.