Skip to main content

Por qué la nueva GPU de Nvidia funciona peor que los gráficos integrados

Cuatro GPU HPC Nvidia H100 una al lado de la otra.
Geekerwan

Uno podría pensar que una GPU que cuesta más de $ 40,000 será la mejor tarjeta gráfica para juegos, pero la verdad es mucho más compleja que eso. De hecho, esta GPU Nvidia ni siquiera puede mantenerse al día con las soluciones gráficas integradas.

Ahora, antes de que te enojes demasiado, debes saber que me refiero al H100 de Nvidia, que alberga el chip GH100 (Grace Hopper). Es una potente GPU de centro de datos hecha para manejar tareas de computación de alto rendimiento (HPC), no para alimentar juegos de PC. No tiene ninguna salida de pantalla, y a pesar de sus amplias capacidades, tampoco tiene refrigeradores. Esto se debe a que, nuevamente, encontraría esta GPU en un centro de datos o en un entorno de servidor, donde se enfriaría con potentes ventiladores externos.

Si bien «solo» tiene 14,592 núcleos CUDA (que es menos que el RTX 4090), también tiene una cantidad insana de VRAM y un bus masivo. En total, la GPU tiene 80 GB de memoria HBM2e, dividida en cinco pilas HBM, cada una conectada a un bus de 1024 bits. A diferencia de las GPU de consumo de Nvidia, esta tarjeta también tiene NVLink, lo que significa que se puede conectar para funcionar sin problemas en sistemas multi-GPU.

La pregunta sigue siendo: ¿Por qué exactamente este tipo de GPU es tan malo en el uso general y los juegos?

Para demostrar el caso, YouTuber Gamerwan recibió cuatro de estas tarjetas gráficas H100 para probar, y decidió poner una en un sistema Windows normal para verificar su rendimiento. Este era un modelo PCIe 5.0, y tuvo que ser emparejado con una RTX 4090 debido a la falta de salidas de pantalla. Gamerwan también imprimió en 3D un refrigerador externo diseñado a medida para mantener la GPU funcionando sin problemas.

Se necesita un poco de trabajo incluso para que el sistema reconozca el H100 como una GPU adecuada, pero una vez que Gamerwan logró superar los obstáculos, también pudo activar el soporte de trazado de rayos. Sin embargo, como descubrimos más tarde a lo largo de las pruebas, no hay mucho soporte para nada más en una plataforma que no sea de centro de datos.

En una prueba estándar de 3DMark Time Spy, la GPU solo alcanzó los 2.681 puntos. A modo de comparación, el puntaje promedio para el RTX 4090 es de 30,353 puntos. Esta puntuación coloca a la H100 en algún lugar entre la GTX 1050 de consumo y la GTX 1060. Más importante aún, es casi lo mismo que la Radeon 680M de AMD, que es una GPU integrada.

Las pruebas de juego también fueron mal, con la tarjeta gráfica alcanzando un promedio de 8 cuadros por segundo (fps) en Red Dead Redemption 2. La falta de soporte de software asoma su fea cabeza aquí: aunque el H100 puede funcionar a un máximo de 350 vatios, el sistema parece no poder superarlo de 100W, lo que resulta en un rendimiento enormemente limitado.

Comparación entre la arquitectura de las GPU H100 y AD102.
Gamerwan

Hay algunas razones diferentes para esta pobre muestra de poderes de juego. Por un lado, aunque la H100 es una tarjeta gráfica ultra fuerte en papel, es muy diferente a nivel arquitectónico que la GPU AD102 que alimenta la RTX 4090. Solo tiene 24 unidades operativas ráster (ROP), lo que es una degradación significativa de los 160 ROP que tiene la RTX 4090. Además, solo cuatro de los 112 clústeres de procesamiento de texturas (TPC) pueden representar cargas de trabajo de gráficos.

Las GPU de consumo de Nvidia reciben mucho soporte en el lado del software para funcionar bien. Esto incluye controladores, pero también soporte de sistemas de desarrolladores, tanto en juegos como en programas de referencia. No hay controladores que optimicen el rendimiento de esta GPU para el juego, y el resultado es, como puede ver, extremadamente pobre.

Ya hemos visto el poder de los controladores con Intel Arc, donde el hardware se ha mantenido igual, pero el soporte mejorado del controlador brindó ganancias de rendimiento que hicieron de Arc una opción aceptable si está comprando una GPU económica. Sin controladores Nvidia Game Ready y sin acceso al resto de la pila de software de Nvidia (incluido el siempre impresionante DLSS 3), el H100 es una GPU de $ 40,000 que no tiene por qué ejecutar ningún tipo de juego.

En esencia, esta es una GPU informática, y no una tarjeta gráfica de la misma manera que la mayoría de nosotros las conocemos. Fue hecho para todo tipo de tareas de HPC, con un fuerte enfoque en las cargas de trabajo de IA. Nvidia mantiene una fuerte ventaja sobre AMD en lo que respecta a la IA, y tarjetas como la H100 juegan un papel importante en eso.

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Conozca Blackwell, la arquitectura de GPU de próxima generación de Nvidia
blackwell arquitectura gpu nvidia

Nvidia
Finalmente tenemos nuestra primera muestra de la próxima generación de GPU de Nvidia, llamada Blackwell. Claro, están diseñados para empresas, y no, no ejecutarán Cyberpunk 2077 (al menos no oficialmente). Pero este es el primer vistazo que tenemos a lo que Nvidia está preparando para sus GPU de la serie RTX 50, que se rumorea que se lanzarán en algún momento del próximo año.

La GPU que tenemos hoy en día es la B200 (Blackwell 200, si puedes detectarla) que viene con 208 mil millones de transistores. La arquitectura se basa en el nodo 4NP de TSMC, que es una versión mejorada del nodo de 5 nm. Es un poco sorprendente dado que las GPU Ada Lovelace de Nvidia están construidas con el nodo 4N de TSMC, a un paso de 4NP. Sin embargo, Nvidia señala que está utilizando una versión personalizada de este proceso.
Nvidia
Nvidia estableció seis parámetros que distinguen a Blackwell. El primero es el proceso 4NP personalizado, que Nvidia está utilizando para conectar dos matrices de GPU a través de una interconexión de 10 TB por segundo. El segundo es un motor transformador actualizado. Nvidia dice que la arquitectura puede manejar el doble del tamaño del modelo de la última generación de Ada Lovelace, y es compatible con un nuevo conjunto de instrucciones de coma flotante de 4 bits.

Leer más
Esta característica de la GPU es un paradigma completamente nuevo
gpu caracteristica work graphs

Jacob Roach / DT
Microsoft ha lanzado su Agility SDK 1.613.0, que presenta algunos componentes críticos que se mostrarán a los desarrolladores en la Game Developers Conference (GDC) en San Francisco la próxima semana. El componente más interesante es Work Graphs, que Microsoft describe como "un paradigma completamente nuevo" para las tarjetas gráficas.

Los gráficos de trabajo permiten el trabajo controlado por GPU. Normalmente, cuando juegas a un juego de PC, hay una relación entre la GPU y la CPU. La CPU prepara el trabajo y lo envía a la GPU y, a continuación, la GPU ejecuta ese trabajo. Work Graphs es un enfoque que permite a la GPU programar y ejecutar sus propias tareas, lo que tiene algunas implicaciones masivas para el rendimiento.

Leer más
Las viejas GPU de Nvidia acaban de recibir una gran actualización
viejas gpu nvidia reciben gran actualizacion

Bill Roberson / DT
Los modders acaban de dar una gran actualización a las GPU de la serie RTX 20 y GTX 16 de Nvidia. El mod se llama NvStrapsReBar y, como su nombre indica, agrega soporte para Resizable Bar (ReBAR) a las tarjetas gráficas Nvidia más antiguas.

ReBAR es una característica esencial en las GPU modernas, compatible con Nvidia y AMD, y explícitamente requerida para las tarjetas gráficas Arc de Intel. Sin embargo, no se introdujo hasta las tarjetas gráficas RX 6000 de AMD y RTX 30 de Nvidia. El desarrollador Terminatorul ha ideado una solución modificando la UEFI de su placa base.

Leer más