Nvidia acaba de anunciar una nueva supercomputadora que puede cambiar el futuro de la IA. La DGX GH200, equipada con casi 500 veces más memoria que los sistemas con los que estamos familiarizados ahora, pronto caerá en manos de Google, Meta y Microsoft.
¿El objetivo? Revolucionando la IA generativa, los sistemas de recomendación y el procesamiento de datos a una escala que nunca antes habíamos visto. ¿Se beneficiarán los modelos de lenguaje como GPT y qué significará eso para los usuarios habituales?
Describir la DGX GH200 de Nvidia requiere el uso de términos con los que la mayoría de los usuarios nunca tienen que lidiar. «Exaflop», por ejemplo, porque la supercomputadora proporciona 1 exaflop de rendimiento y 144 terabytes de memoria compartida. Nvidia señala que esto significa casi 500 veces más memoria que en un solo sistema Nvidia DGX A100.
Volvamos a la figura de 1 exaflop y analicémosla un poco. Un exaflop equivale a un quintillón de operaciones de punto flotante por segundo (FLOP). A modo de comparación, la RTX 4090 de Nvidia puede alcanzar alrededor de 100 teraflops (TFLOP) cuando se overclockea. Un TFLOP equivale a un billón de operaciones de punto flotante por segundo. La diferencia es asombrosa, pero por supuesto, la RTX 4090 no es una GPU de centro de datos. La DGX GH200, por otro lado, integra un número sustancial de estas GPU de alto rendimiento que no pertenecen a una PC de consumo.
La computadora funciona con los superchips GH200 Grace Hopper de Nvidia. Hay 256 de ellos en total, que, gracias a la tecnología de interconexión NVLink de Nvidia, pueden trabajar juntos como un sistema unificado, esencialmente creando una GPU masiva.
Los superchips GH200 utilizados aquí tampoco necesitan una conexión PCIe tradicional entre la CPU y la GPU. Nvidia dice que ya están equipados con una Nvidia Grace CP, U basada en ARM, así como una GPU H100 Tensor Core. Nvidia también tiene algunas interconexiones de chips elegantes aquí, esta vez usando el NVLink-C2C. Como resultado, se dice que el ancho de banda entre el procesador y la tarjeta gráfica mejora significativamente (hasta 7 veces) y es más eficiente en el consumo de energía (hasta 5 veces).
Empaquetar más de 200 de estos chips en una sola potencia de una supercomputadora es lo suficientemente impresionante, pero se vuelve aún mejor cuando se considera que, anteriormente, solo se podían unir ocho GPU con NVLink a la vez. Un salto de ocho a 256 chips ciertamente le da a Nvidia algunos derechos de fanfarronear.
Es difícil no imaginar que el DGX GH200 podría impulsar mejoras en Bard, ChatGPT y Bing Chat.
Ahora, ¿dónde terminará la DGX GH200 y qué puede ofrecer al mundo? Nvidia está construyendo su propia supercomputadora Helios como un medio para avanzar en su investigación y desarrollo de IA. Abarcará cuatro sistemas DGX GH200, todos interconectados con Quantum-2 InfiniBand de Nvidia. Se espera que entre en funcionamiento a finales de año.
Nvidia también está compartiendo su nuevo desarrollo con el mundo, comenzando con Google Cloud, Meta y Microsoft. El propósito es muy similar: explorar las cargas de trabajo generativas de IA.
Cuando se trata de Google y Microsoft, es difícil no imaginar que el DGX GH200 podría impulsar mejoras en Bard, ChatGPT y Bing Chat.
La importante potencia computacional proporcionada por un solo sistema DGX GH200 lo hace muy adecuado para avanzar en el entrenamiento de modelos de lenguaje sofisticados. Es difícil decir qué podría significar exactamente eso sin el comentario de una de las partes interesadas, pero podemos especular un poco.
Más potencia significa modelos más grandes, lo que significa texto más matizado y preciso y una gama más amplia de datos para entrenarlos. Podríamos ver una mejor comprensión cultural, más conocimiento del contexto y una mayor coherencia. Los chatbots especializados de IA también podrían comenzar a aparecer, reemplazando aún más a los humanos en campos como la tecnología.
¿Deberíamos preocuparnos por el posible desplazamiento de empleos, o deberíamos estar entusiasmados con los avances que estas supercomputadoras podrían traer? La respuesta no es sencilla. Una cosa es segura: el DGX GH200 de Nvidia podría sacudir las cosas en el mundo de la IA, y Nvidia acaba de aumentar su liderazgo en IA sobre AMD una vez más.