Editor en La Ecuación Digital. Consultor de Innovación y Estrategia…
Durante el Oracle CloudWorld, celebrado en Las Vegas, Oracle presentó su primer clúster de computación en la nube zettascale , impulsado por la plataforma NVIDIA Blackwell.
Esta nueva infraestructura de Oracle Cloud Infrastructure (OCI) se posiciona como el superordenador más potente en la nube, ofreciendo hasta 131,072 GPUs NVIDIA Blackwell, lo que permitirá a los clientes desarrollar, entrenar e inferir modelos de inteligencia artificial (IA) a una escala sin precedentes.
La infraestructura de IA más avanzada de OCI
Mahesh Thiagarajan, vicepresidente ejecutivo de Oracle Cloud Infrastructure, destacó que la oferta de infraestructuras de IA de Oracle abarca una de las más amplias del mercado, con capacidad para soportar cargas de trabajo extremadamente exigentes.
Según Thiagarajan, esta capacidad permite a las empresas desplegar servicios de IA y nube con flexibilidad, adaptándolos a sus necesidades geográficas, mientras se preservan altos niveles de soberanía tanto de los datos como de los algoritmos de IA.
Clúster de computación zettascale: características y rendimiento
El clúster zettascale de OCI, ya disponible para pedidos, ofrece un rendimiento máximo de hasta 2.4 zettaFLOPS, lo que equivale a más del triple de GPUs que el superordenador Frontier y seis veces más que otros proveedores de hiperescala. Esta infraestructura incluye componentes como OCI Compute Bare Metal, redes de baja latencia basadas en RoCEv2, y conectividad mediante las tecnologías ConnectX-7 NICs o InfiniBand NVIDIA Quantum-2, junto con opciones avanzadas de almacenamiento HPC.
Además, el clúster se ofrece con diversas configuraciones de GPU, entre ellas las NVIDIA H100, H200 y Blackwell. Los clústeres equipados con GPUs H100 pueden escalar hasta 16,384 GPUs, alcanzando un rendimiento de 65 ExaFLOPS, mientras que los que emplean GPUs H200 pueden escalar hasta 65,536 GPUs, con un rendimiento de hasta 260 ExaFLOPS. Para finales de 2024, Oracle planea ofrecer instancias de bare metal refrigeradas por líquido con GPUs NVIDIA GB200 NVL72, que permitirán la comunicación de hasta 72 GPUs con un ancho de banda de 129.6 TB/s en un único dominio NVLink.
Un salto crítico en la innovación de IA
Ian Buck, vicepresidente de Hiperscale y Computación de Alto Rendimiento en NVIDIA, subrayó la relevancia de esta colaboración para el ecosistema de IA. Según Buck, el acceso a infraestructuras de computación y software de IA a gran escala es esencial para impulsar la innovación, tanto en el ámbito empresarial como en el académico. La alianza entre Oracle y NVIDIA permite que organizaciones de todo el mundo tengan acceso a capacidades de cómputo de IA sin precedentes, acelerando el desarrollo y el despliegue de soluciones de IA de vanguardia a nivel global.
Casos de uso destacados
WideLabs: IA aplicada al sector salud
WideLabs, una startup brasileña especializada en IA aplicada, está utilizando la infraestructura de OCI para entrenar Amazonia IA, uno de los modelos de lenguaje más grandes de Brasil. Este modelo impulsa bAIgrapher, una aplicación diseñada para generar contenido biográfico a partir de datos de pacientes con Alzheimer, ayudando a preservar recuerdos valiosos para estos pacientes.
Para cumplir con los requisitos de soberanía de datos en Brasil, WideLabs opera en la región de Oracle Cloud en São Paulo, lo que garantiza que los datos sensibles se mantengan dentro de las fronteras del país. Para sus tareas de entrenamiento, la empresa utiliza GPUs NVIDIA H100 y gestiona contenedores acelerados por GPU con Oracle Kubernetes Engine, aprovechando la escalabilidad y eficiencia de los clústeres de OCI.
Zoom: IA generativa con soberanía de datos
Zoom se apoya en la infraestructura de OCI para desplegar su asistente personal de IA, Zoom AI Companion. Este asistente facilita a los usuarios la redacción de correos electrónicos, la síntesis de reuniones, la generación de ideas y más. Un aspecto clave para Zoom es la capacidad de OCI para cumplir con los requisitos de soberanía de datos, comenzando por su implementación en Arabia Saudita, donde la plataforma ayuda a mantener los datos de los clientes en su ubicación de origen.