Laboratorio chino de IA afirma que puede igualar al todopoderoso Claude Mythos

Durante las últimas semanas, Mythos de Anthropic ha sido considerado el estándar de oro para la ciberseguridad impulsada por IA. Esa ventaja puede que ya esté disminuyendo. Según un nuevo informe de The Wall Street Journal, investigadores de seguridad afirman que el GLM-5.2 de la startup china de IA Z.ai puede ahora igualar a Mythos en cuanto a la detección de vulnerabilidades de seguridad de software, aunque siga quedando por detrás de Anthropic y OpenAI en tareas de razonamiento más amplias.

GLM-5.2 está cerrando la brecha en un área muy importante

Según el informe, los investigadores encontraron que GLM-5.2 funciona a la par con Mythos en la identificación de errores de software, una capacidad que se está volviendo cada vez más importante a medida que las empresas se apresuran a parchear vulnerabilidades antes de que los hackers puedan explotarlas. El modelo también es de código abierto, lo que significa que cualquiera puede descargarlo, modificarlo y ejecutarlo en su propio hardware sin depender de un proveedor de nube. Esa flexibilidad la hace atractiva para las empresas, pero también genera preocupación de que los ciberdelincuentes puedan adaptarla con fines ofensivos.

El informe se cuida de señalar que esto no significa que China haya superado a Estados Unidos en IA en general. GLM-5.2 sigue quedándose por detrás de Anthropic y OpenAI en muchas tareas de propósito general. Pero en ciberseguridad, donde incluso pequeñas mejoras pueden tener consecuencias reales desproporcionadas, la brecha de rendimiento se ha reducido drásticamente. Según datos de benchmark citados por la revista, GLM-5.2 incluso ha superado a Claude Opus 4.8 en algunas evaluaciones de seguridad, mientras que los investigadores afirman que un prompting adicional le permite alcanzar un rendimiento de detección de errores a nivel de Mythos.

La cuestión principal no es quién gana. Es lo rápido que se está cerrando la brecha

Curiosamente, todo esto llega en un momento bastante incómodo para la industria de la IA estadounidense. Mientras empresas como Anthropic y OpenAI han pasado las últimas semanas restringiendo el acceso a sus modelos fronterizos más avanzados por motivos de seguridad nacional, los laboratorios chinos han ido en la dirección opuesta lanzando alternativas de peso abierto cada vez más capaces que cualquiera puede descargar y ejecutar.

Lo curioso es que este debate ya se estaba desarrollando en público. Hace apenas unos días, Elon Musk predijo que los laboratorios de IA chinos probablemente alcanzarían al nivel del buque insignia de Anthropic, Fable 5, para el primer trimestre de 2027, al menos en términos de rendimiento de referencia. El fundador de Zhipu AI, Tang Jie, respondió rápidamente, «no tardará tanto.» Musk aclaró entonces su postura, argumentando que, aunque China podría igualar a Anthropic en los puntos de referencia para entonces, alcanzar el mismo nivel de «utilidad real» sería un hito mucho más difícil, reconociendo el enfoque de Anthropic en la inteligencia práctica.

On benchmarks, yes, but as measured by true usefulness even Q1 would be very impressive.

Anthropic has rightly focused on maximizing useful intelligence, which does not show up in benchmarks, but definitely shows up in revenue.
— Elon Musk (@elonmusk) June 18, 2026

Ahora, el último informe de The Wall Street Journal da un poco más de peso al optimismo de Tang. En lugar de hablar de benchmarks de codificación, sugiere que GLM-5.2 ya está igualando el Mito de Anthropic en la detección de vulnerabilidades de seguridad, posiblemente una de las aplicaciones de IA más valiosas del mundo real actuales. Eso no convierte a China de repente en líder en IA de frontera, pero hay algo que cada vez es más difícil de ignorar: la carrera de la IA ya no es una ventaja cómoda para Estados Unidos.