Las últimas GPU Blackwell de Nvidia están teniendo problemas en el centro de datos, informa The Information. Según el informe, los clientes de Nvidia están preocupados por lo bien que se mantendrán los aceleradores de IA, ya que los problemas de sobrecalentamiento han causado retrasos en los racks de servidores que se implementan para el entrenamiento de IA.
La arquitectura Blackwell está en el corazón tanto de los aceleradores de IA de próxima generación de Nvidia como de sus próximas tarjetas gráficas de la serie RTX 50. En el centro de datos, la arquitectura se retrasó anteriormente debido a «defectos de diseño», lo que retrasó la implementación de las GPU B100 y B200. Eso a pesar de los grandes pedidos con actores de la IA como Meta, Microsoft y Google.
Según el informe, el gran problema en el centro de datos se deriva de apiñar 72 de los aceleradores de IA en un rack de servidores, lo que ha provocado problemas de sobrecalentamiento. Reuters informa de que Nvidia ha pedido a los proveedores que rediseñen los bastidores de servidores «varias veces» para solucionar los problemas de sobrecalentamiento.
Blackwell es un paso importante para Nvidia. Está en el corazón de la próxima generación de GPU, que podría ganar lugares entre las mejores tarjetas gráficas. Blackwell también es un punto para que Nvidia consolide su ventaja por delante de AMD. Team Red ya ha desplegado su acelerador de IA MI300X en centros de datos, y actualmente está desplegando su acelerador MI325X mientras prepara los chips de IA de próxima generación.
Afirmaciones de Nvidia Blackwell es capaz de entrenar modelos de lenguaje de gran tamaño a un coste y un consumo de energía 25 veces menores en comparación con su arquitectura Hopper de última generación, o que es capaz de entrenar estos modelos hasta 30 veces más rápido. Ese tipo de aceleración tiene un gran impacto en el calor, que ya es un problema con el que los centros de datos deben lidiar cuando se trata de aceleradores de IA.
También podría tener implicaciones para las GPU de la serie RTX 50. Aunque sabemos que tarjetas como la RTX 4090 son increíblemente eficientes cuando se trata de juegos, el anterior buque insignia de Nvidia seguía teniendo problemas con el alto consumo de energía y el derretimiento de los conectores de alimentación. La última especulación es que una tarjeta como la RTX 5090 podría aumentar los requisitos de energía, hasta 600 vatios. Corsair también confirmó que las tarjetas gráficas de próxima generación de Nvidia se quedarán con el conector 12V-2×6 que ha estado en el centro de los problemas de fusión en la RTX 4090.
Los jugadores no meterán 72 RTX 5090 dentro de un PC, pero la escala de los problemas de sobrecalentamiento es diferente entre un centro de datos y un PC de sobremesa. Si la arquitectura Blackwell se encuentra con estos problemas en el centro de datos, podría significar problemas para la gama de computadoras de escritorio de Nvidia.
Por ahora, todo lo que podemos hacer es esperar. Se espera que Nvidia revele sus GPU de la serie RTX 50 en enero en el CES 2025. Informes recientes sugieren que Nvidia está reduciendo la producción de sus tarjetas de la serie RTX 40, lo que probablemente despeje el camino para las opciones de próxima generación.