Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

Un grupo de científicos le hicieron un jailbreak a ChatGPT

Imagen utilizada con permiso del titular de los derechos de autor

Un grupo de investigadores ha descubierto que es posible eludir el mecanismo arraigado en los chatbots de IA para que puedan responder a consultas sobre temas prohibidos o delicados mediante el uso de un chatbot de IA diferente como parte del proceso de entrenamiento.

Un equipo de científicos informáticos de la Universidad Tecnológica de Nanyang (NTU) de Singapur llama extraoficialmente al método un «jailbreak», pero es más oficialmente un proceso «Masterkey». Este sistema utiliza chatbots, incluidos ChatGPT, Google Bard y Microsoft Bing Chat, entre sí en un método de entrenamiento de dos partes que permite que dos chatbots aprendan los modelos del otro y desvíen cualquier comando contra temas prohibidos.

Recommended Videos

El equipo incluye al profesor Liu Yang y a los estudiantes de doctorado de la NTU, el Sr. Deng Gelei y el Sr. Liu Yi, coautores de la investigación y desarrolladores los métodos de ataque de prueba de concepto.

Según el equipo, primero aplicaron ingeniería inversa a un gran modelo de lenguaje (LLM) para exponer sus mecanismos de defensa. Originalmente, estos serían bloqueos en el modelo y no permitirían que las respuestas a ciertas indicaciones o palabras se procesaran como respuestas debido a intenciones violentas, inmorales o maliciosas.

Pero con esta información sometida a ingeniería inversa, pueden enseñar a un LLM diferente cómo crear un bypass. Con el bypass creado, el segundo modelo podrá expresarse más libremente, basándose en el LLM de ingeniería inversa del primer modelo. El equipo llama a este proceso «Masterkey» porque debería funcionar incluso si los chatbots de LLM se fortalecen con seguridad adicional o se parchean en el futuro.

El profesor Lui Yang señaló que el quid del proceso es que muestra la facilidad con la que los chatbots de IA de LLM pueden aprender y adaptarse. El equipo afirma que su proceso Masterkey ha tenido tres veces más éxito en el jailbreak de chatbots LLM que un proceso de solicitud tradicional. Del mismo modo, algunos expertos argumentan que los fallos recientemente propuestos que han experimentado ciertos LLM, como GPT-4, son signos de que se está volviendo más avanzado, en lugar de más tonto y perezoso, como han afirmado algunos críticos.

El equipo de investigación de la NTU se puso en contacto con los proveedores de servicios de chatbot de IA que participaron en el estudio sobre sus datos de prueba de concepto, que muestran que el jailbreak para los chatbots es real. El equipo también presentará sus hallazgos en el Simposio de Seguridad de Redes y Sistemas Distribuidos en San Diego en febrero.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El Padrino de la IA dice que Google superará con creces a OpenAI
Geoffrey Hinton

Geoffrey Hinton, investigador legendario considerado uno de los pioneros fundamentales en el desarrollo de la inteligencia artificial moderna, ha realizado una declaración que genera reverberaciones significativas dentro de la industria tecnológica: sostiene que Google está en proceso de superar a OpenAI en la competición por liderar la próxima generación de sistemas de IA. Esta evaluación proviene de una figura cuya trayectoria científica incluye contribuciones decisivas a los campos del aprendizaje profundo y las redes neuronales, galardones que le permitieron obtener el Premio Nobel de Física en 2024.​

Durante una entrevista concedida a Business Insider, Hinton reflexionó sobre la ironía histórica de esta situación. Recordó que Google fue pionera en tecnología de transformadores desde 2017, cuando sus investigadores publicaron el revolucionario artículo "Attention Is All You Need" que transformaría radicalmente el panorama de la IA. Además, Google desarrolló chatbots avanzados antes que cualquier otra organización, pero una postura excesivamente cautelosa limitó su velocidad en la comercialización de estas tecnologías. Hinton atribuyó esta prudencia a la preocupación corporativa por proteger la reputación global de Google tras observar los desastres de imagen que enfrentó Microsoft con su fallido chatbot Tay en 2016, cuando la herramienta generó contenido ofensivo en redes sociales.

Read more
¿Quién es el nuevo amo y señor del Mundial de Excel?
Mundial Excel

Diarmuid Early, un consultor financiero irlandés con experiencia especializada en modelado financiero avanzado, se ha coronado como campeón del Microsoft Excel World Championship 2025, consolidando su posición como la máxima autoridad global en el dominio de la aplicación de hojas de cálculo mediante un desempeño que dejó un margen de superioridad abrumador sobre sus competidores.

Early completó exitosamente todos los desafíos presentados en la final en vivo realizada en la HyperX Arena de Las Vegas, terminando su caso ganador con una ventaja de más de cinco minutos sobre sus rivales más cercanos en tiempo de ejecución.​

Read more
Tu próximo PC Dell o Lenovo podría costar más muy pronto
Computer, Computer Hardware, Computer Keyboard

¿Qué ha pasado? La crisis de oferta en DRAM y NAND flash, impulsada inicialmente por el aumento de la demanda de los centros de datos de IA, ha afectado por fin duramente al hardware de consumo. Según informes recientes del sector a través de TrendForce, las principales marcas están reaccionando: según se informa, Dell y Lenovo están preparando aumentos significativos de precios en sus líneas de PC y servidores para absorber el aumento vertiginoso de los costes de los componentes. Esto ocurre después de que HP ya advirtiera de subidas de precios en su gama de PCs y portátiles, mientras que AMD también advirtió sobre un aumento en los precios de sus GPU.

Según se informa, Dell planea un aumento del 15–20% en muchos de sus servidores y PC tan pronto como a mediados de diciembre.

Read more