
Editor en La Ecuación Digital. Consultor de Innovación y Estrategia…
Huawei ha presentado su nuevo sistema de computación a gran escala para inteligencia artificial, el CloudMatrix 384 (CM384), como alternativa nacional al modelo GB200 NVL72 de Nvidia. Compuesto por 384 chips Ascend 910C conectados en una arquitectura de topología completa, el sistema busca maximizar el rendimiento desde el nivel de infraestructura, superando en capacidad de cálculo y ancho de banda a su homólogo estadounidense.
Según el análisis técnico publicado por Semianalysis, esta solución destaca no solo por la cantidad de unidades de procesamiento, sino por los avances en red, óptica y software que definen su enfoque arquitectónico.
Aunque el chip Ascend no es nuevo, Huawei ha optado por escalar en el nivel de integración del sistema. Mientras Nvidia centra parte de su ventaja en el rendimiento unitario de sus GPU, Huawei ha apostado por un modelo de alta densidad y gran volumen computacional, donde el número de chips compensa la diferencia de rendimiento individual.
Arquitectura del CloudMatrix 384 y rendimiento
La clave del CM384 reside en una arquitectura de conexión all-to-all, que enlaza los 384 procesadores Ascend 910C con una topología completa, lo que permite una comunicación directa y densa entre nodos. Cada chip Ascend 910C ofrece aproximadamente un tercio del rendimiento de un GPU Blackwell de Nvidia, pero al quintuplicar su número en el sistema, Huawei consigue 300 PFLOPs en operaciones BF16, cifra que casi duplica los 170 PFLOPs del GB200 NVL72.
Además del cómputo, el sistema ofrece 3,6 veces más capacidad de memoria agregada y 2,1 veces más ancho de banda de memoria respecto a la solución de Nvidia. En conjunto, el CloudMatrix 384 representa una potencia de cálculo considerablemente superior en cargas de trabajo específicas.
Coste energético y limitaciones
El principal factor negativo del sistema es su alto consumo energético. El CM384 requiere 3,9 veces más energía que el GB200 NVL72 y muestra una eficiencia notablemente menor en varias métricas:
-
2,3 veces peor en energía por FLOP
-
1,8 veces peor en energía por TB/s de ancho de banda
-
1,1 veces peor en energía por TB de memoria HBM
Sin embargo, en el contexto industrial chino, esta penalización energética no representa un obstáculo estructural. A diferencia de Occidente, donde las limitaciones energéticas son un factor determinante en el diseño de sistemas de IA, en China el cuello de botella reside en la disponibilidad de semiconductores avanzados, no en la capacidad de generación eléctrica.
Infraestructura energética y escalabilidad
La diferencia energética estructural entre China y Estados Unidos se refleja en la evolución de sus redes de suministro. Mientras que EE. UU. ha optado en la última década por fuentes renovables y eficiencia energética, China ha seguido ampliando su infraestructura basada en carbón, nuclear, solar e hidroeléctrica, lo que ha permitido añadir una capacidad energética equivalente a toda la red eléctrica estadounidense desde 2011.
Este exceso relativo de energía ha permitido a Huawei diseñar su arquitectura sin priorizar la eficiencia energética, y centrándose en escalabilidad, integración óptica y tolerancia a fallos en red, puntos donde se apoya el CM384 para justificar su enfoque.
Producción de los Ascend 910C: dependencias y estrategias
Pese a ser diseñados íntegramente en China, los chips Ascend 910C no son fabricados localmente en su totalidad. Aunque SMIC, la fundición más avanzada de China, cuenta con capacidades de 7nm, la mayor parte de los chips 910C siguen siendo fabricados por TSMC, en Taiwán. Investigaciones del Gobierno de EE. UU. y entidades como TechInsights han confirmado que los lotes analizados utilizan obleas fabricadas por TSMC.
Huawei ha podido eludir parcialmente las sanciones estadounidenses mediante adquisiciones indirectas. A través de la firma Sophgo, se habrían adquirido aproximadamente 500 millones de dólares en obleas de 7nm, lo que provocó una multa de 1.000 millones de dólares a TSMC, equivalente al doble del beneficio obtenido por esa operación.
Acceso a memoria HBM: el papel de Samsung
Uno de los componentes más críticos del sistema es la memoria de alto ancho de banda (HBM), que China no puede producir aún en volúmenes industriales. La empresa CXMT, que lidera el desarrollo local, no alcanzará una producción significativa hasta 2026. Mientras tanto, Samsung ha mantenido un suministro continuo de HBM hacia China.
Huawei ha logrado acumular 13 millones de unidades de HBM, suficientes para montar 1,6 millones de paquetes Ascend 910C. A pesar de las restricciones en exportaciones de HBM en bruto, los chips que incorporan HBM sí pueden seguir siendo enviados, siempre que no superen los límites establecidos en FLOPs. Esta brecha en el marco regulador ha permitido seguir importando componentes a través de terceros.
Uno de los canales detectados incluye a CoAsia Electronics, distribuidor de Samsung para la región china, que entrega HBM2E a la empresa taiwanesa Faraday, la cual empaqueta el componente junto con una lógica de 16nm, permitiendo su entrada formal a China. Una vez allí, los fabricantes recuperan los módulos HBM mediante procesos de desoldado, presumiblemente optimizados mediante soldaduras de baja temperatura para facilitar la extracción del componente.
Perspectivas de producción nacional
El número potencial de CM384 que puede ensamblar Huawei está condicionado por la disponibilidad de chips Ascend 910C y de memoria HBM. Aunque Huawei ha aumentado su autonomía en diseño y ensamblaje, sigue existiendo una fuerte dependencia de componentes críticos extranjeros, especialmente en obleas avanzadas, memoria HBM y equipos de fabricación procedentes de EE. UU., Países Bajos y Japón.
La progresión futura del CloudMatrix dependerá, por tanto, de la evolución de la capacidad industrial china para producir estos componentes localmente o seguir sorteando las restricciones vigentes mediante canales alternativos.
Escenarios de evolución tecnológica
Aunque Huawei aún está un paso atrás en cuanto a microarquitectura de chip respecto a Nvidia o AMD, su enfoque de escalabilidad a nivel de sistema lo sitúa por delante en rendimiento agregado en ciertas métricas. La evolución del CloudMatrix 384 plantea una alternativa viable de computación a gran escala para China en el actual contexto geopolítico, aunque su sostenibilidad dependerá de factores externos como nuevas sanciones o avances en producción nacional.
El diseño del CM384 evidencia que, más allá del rendimiento por chip, las arquitecturas orientadas a la integración masiva y el diseño de redes pueden marcar la diferencia en los entornos donde la energía no es un factor limitante, y donde el suministro de chips sí lo es.