Estás leyendo
NVIDIA presenta Cosmos: Plataforma de Modelos Fundacionales para Impulsar la IA Física

NVIDIA presenta Cosmos: Plataforma de Modelos Fundacionales para Impulsar la IA Física

  • NVIDIA presenta Cosmos, una plataforma de IA Física con modelos fundacionales abiertos, tokenizadores avanzados y simulaciones multiverso, diseñada para acelerar el desarrollo de robots y vehículos autónomos.
Nvidia - Cosmos

NVIDIA lanzó hoy  Cosmos™ , una plataforma innovadora diseñada para acelerar el desarrollo de la . Compuesta por modelos generativos de última generación, tokenizadores avanzados y un pipeline acelerado de procesamiento de datos, Cosmos está especialmente optimizada para crear sistemas como robots y vehículos autónomos. Este anuncio marca un hito en la integración de la inteligencia artificial en el mundo físico.

La IA Física y su importancia en la innovación

La IA Física busca dotar a las máquinas de la capacidad de comprender y actuar en el mundo real, integrando conceptos como la permanencia de objetos, las interacciones físicas y las dinámicas del entorno. Jensen Huang, fundador y CEO de , describió Cosmos como un catalizador que democratiza esta tecnología: “El momento ChatGPT para la robótica está cerca. Los modelos fundacionales son esenciales para avanzar en el desarrollo de robots y vehículos autónomos, pero no todos los desarrolladores tienen los recursos para entrenarlos desde cero. Cosmos facilita este proceso”.

Componentes de NVIDIA Cosmos

La plataforma está diseñada para superar los retos asociados al desarrollo de la IA Física, como el alto coste y la necesidad de grandes volúmenes de datos del mundo real. Cosmos ofrece herramientas clave para entrenar y personalizar modelos de IA física de forma eficiente:

  • Modelos fundacionales abiertos: Generan datos sintéticos realistas basados en texto, imágenes, videos y datos de sensores robóticos. Estos modelos permiten crear entornos como fábricas, almacenes o carreteras con diversas condiciones climáticas y de tráfico.
  • Tokenizador de video Cosmos: Convierte imágenes y videos en tokens con una compresión 8 veces mayor y un procesamiento 12 veces más rápido que los tokenizadores actuales.
  • Pipeline acelerado: Con tecnología NVIDIA AI y CUDA, procesa 20 millones de horas de video en solo 14 días usando la plataforma Blackwell, en comparación con los más de tres años que requeriría un pipeline basado en CPU.

Aplicaciones prácticas de Cosmos

NVIDIA Cosmos está diseñado para abordar las necesidades de industrias como la robótica, la automoción y la logística. Algunas de sus aplicaciones destacadas incluyen:

  • Generación de datos sintéticos: Creación de videos fotorealistas basados en escenarios controlados desarrollados en NVIDIA Omniverse™, como entornos de conducción o procesos industriales.
  • Simulación de futuros posibles: Cosmos puede generar múltiples resultados simulados, ayudando a los modelos de IA a seleccionar las decisiones más óptimas.
  • Desarrollo y evaluación de modelos físicos: Personalización y mejora de modelos mediante aprendizaje por refuerzo y simulaciones avanzadas.
  • Búsqueda y análisis de video: Identificación de escenarios específicos, como condiciones de carretera con nieve o congestión en almacenes, para entrenar sistemas autónomos.

Adopción temprana por líderes de la industria

NVIDIA Cosmos ya está siendo utilizado por pioneros de la IA Física. Empresas como Uber, XPENG, Agile Robots y Waabi han adoptado la plataforma para acelerar el desarrollo de sus sistemas autónomos y robóticos:

Te puede interesar
Transporte urbano

  • Uber: Está colaborando con NVIDIA para combinar los datos de conducción de su flota con las capacidades de Cosmos, mejorando la eficiencia en la creación de modelos avanzados para vehículos autónomos.
  • Waabi: Utiliza Cosmos para optimizar la curación de datos en sus sistemas de software para vehículos autónomos.
  • XPENG: Emplea Cosmos en el desarrollo de sus robots humanoides.

Compromiso con la IA confiable y segura

NVIDIA Cosmos incluye herramientas para garantizar el desarrollo responsable de la IA. Los modelos generados integran marcas de agua invisibles para identificar contenido creado por IA, reduciendo riesgos de desinformación. Además, la plataforma sigue los principios de IA confiable de NVIDIA, priorizando la privacidad, la seguridad y la transparencia.

Disponibilidad

Los modelos fundacionales de Cosmos están disponibles bajo licencia abierta en Hugging Face y el catálogo de NVIDIA NGC. Próximamente, estarán disponibles como microservicios optimizados de NVIDIA NIM. Los desarrolladores también pueden acceder a NVIDIA NeMo Curator para personalizar sus propios modelos y desplegarlos mediante NVIDIA DGX Cloud con soporte empresarial.

Utilizamos cookies para facilitar la relación de los visitantes con nuestro contenido y para permitir elaborar estadísticas sobre las visitantes que recibimos. No se utilizan cookies con fines publicitarios ni se almacena información de tipo personal. Puede gestionar las cookies desde aquí.   
Privacidad