Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

Un grupo de científicos le hicieron un jailbreak a ChatGPT

Add as a preferred source on Google
Imagen utilizada con permiso del titular de los derechos de autor

Un grupo de investigadores ha descubierto que es posible eludir el mecanismo arraigado en los chatbots de IA para que puedan responder a consultas sobre temas prohibidos o delicados mediante el uso de un chatbot de IA diferente como parte del proceso de entrenamiento.

Un equipo de científicos informáticos de la Universidad Tecnológica de Nanyang (NTU) de Singapur llama extraoficialmente al método un «jailbreak», pero es más oficialmente un proceso «Masterkey». Este sistema utiliza chatbots, incluidos ChatGPT, Google Bard y Microsoft Bing Chat, entre sí en un método de entrenamiento de dos partes que permite que dos chatbots aprendan los modelos del otro y desvíen cualquier comando contra temas prohibidos.

Recommended Videos

El equipo incluye al profesor Liu Yang y a los estudiantes de doctorado de la NTU, el Sr. Deng Gelei y el Sr. Liu Yi, coautores de la investigación y desarrolladores los métodos de ataque de prueba de concepto.

Según el equipo, primero aplicaron ingeniería inversa a un gran modelo de lenguaje (LLM) para exponer sus mecanismos de defensa. Originalmente, estos serían bloqueos en el modelo y no permitirían que las respuestas a ciertas indicaciones o palabras se procesaran como respuestas debido a intenciones violentas, inmorales o maliciosas.

Pero con esta información sometida a ingeniería inversa, pueden enseñar a un LLM diferente cómo crear un bypass. Con el bypass creado, el segundo modelo podrá expresarse más libremente, basándose en el LLM de ingeniería inversa del primer modelo. El equipo llama a este proceso «Masterkey» porque debería funcionar incluso si los chatbots de LLM se fortalecen con seguridad adicional o se parchean en el futuro.

El profesor Lui Yang señaló que el quid del proceso es que muestra la facilidad con la que los chatbots de IA de LLM pueden aprender y adaptarse. El equipo afirma que su proceso Masterkey ha tenido tres veces más éxito en el jailbreak de chatbots LLM que un proceso de solicitud tradicional. Del mismo modo, algunos expertos argumentan que los fallos recientemente propuestos que han experimentado ciertos LLM, como GPT-4, son signos de que se está volviendo más avanzado, en lugar de más tonto y perezoso, como han afirmado algunos críticos.

El equipo de investigación de la NTU se puso en contacto con los proveedores de servicios de chatbot de IA que participaron en el estudio sobre sus datos de prueba de concepto, que muestran que el jailbreak para los chatbots es real. El equipo también presentará sus hallazgos en el Simposio de Seguridad de Redes y Sistemas Distribuidos en San Diego en febrero.

Diego Bastarrica
Diego Bastarrica es Senior Editor y Head of Content en Digital Trends en Español, donde lidera la estrategia editorial, SEO…
Windows 11 lleva años destruyendo silenciosamente tu SSD con la función hibernar
La característica que creías inocente esconde un mecanismo que castiga tu disco sólido con decenas de terabytes de escritura al año — y la mayoría de los usuarios ni lo sabe.
Computer, Electronics, Laptop

Hay procesos que ocurren dentro de tu computador que nunca ves, pero que están teniendo consecuencias muy reales sobre el hardware que compraste. Uno de ellos sucede cada vez que presionas "hibernar" en Windows 11. Parece un gesto pequeño, casi trivial. Pero detrás de esa acción, el sistema operativo ejecuta una operación que, repetida día tras día, puede estar consumiendo silenciosamente la vida útil de tu SSD a un ritmo alarmante.

El problema que nadie te advirtió

Read more
Nvidia asegura haber eliminado el consumo de agua en sus centros de datos 
nvidia-chip

En plena London Climate Week, Nvidia presentó una solución que, según la compañía, resuelve uno de los problemas ambientales más acuciantes de la industria de la inteligencia artificial: el enorme consumo de agua que requieren los centros de datos para mantener sus procesadores a temperatura. La empresa afirma haber logrado una reducción del 100% en el uso de agua gracias a un innovador diseño de enfriamiento líquido de circuito cerrado.

El sistema funciona haciendo circular una mezcla de agua y propilenglicol, similar al líquido anticongelante que se usa en los automóviles, a través de circuitos sellados que operan a 45 grados Celsius. Al tratarse de un circuito completamente cerrado, el agua no se evapora, lo que elimina la necesidad de refrigeración por evaporación, el método que históricamente ha requerido millones de litros de agua por año en instalaciones de gran escala.

Read more
¿Puede una máquina de hielo enfriar una GPU Nvidia RTX?
Máquina de hielo GPU Nvidia RTX

Una máquina de hielo de encimera no es exactamente hardware estándar para PC, pero el YouTuber TrashBench ha demostrado que puede convertirse en un disipador de GPU sorprendentemente eficaz. En un nuevo vídeo, el creador utilizó una máquina de hielo como base para un sistema de refrigeración personalizado para una Nvidia GeForce RTX 3060, y los resultados fueron mucho mejores de lo esperado.

El proyecto se inspiró en otro creador, el Sr. Yeester, que utilizó una máquina de hielo para enfriar una CPU. TrashBench llevó el concepto en una dirección diferente al intentar enfriar una tarjeta gráfica con la propia máquina, en lugar de simplemente echar hielo en un bucle.

Read more