Skip to main content
  1. Home
  2. Computación
  3. Features

Un investigador hace creer a ChatGPT que tiene 102 años y vive en la Matrix

ChatGPT, el modelo amplio de lenguaje más utilizado y prometedor del mundo, puede usarse para extraer información sensible de un usuario, según reportó a OpenAI el investigador en ciberseguridad Johann Rehberger.

Su hallazgo, contado en un videoblog consignado por  ArsTechnica, es una fuente de preocupación, pues señala que “cada que el usuario inicia una nueva conversación ChatGPT continúa extrayendo información”.

Spyware Injection Into ChatGPT's Long-Term Memory (SpAIware)

Aunque la falla ha sido corregida parcialmente, el experimento realizado por Rehberger muestra que los modelos amplios de lenguaje o large language model, como ChatGPT, pueden almacenar información sensible de algún usuario, incluidos datos sensibles mostrados en alguna cuenta de correo electrónico o una plataforma de almacenamiento en la nube.

Recommended Videos

Rehberger probó esta brecha de seguridad creando una prueba de concepto montando información falsa en nubes de Google Drive y OneDrive, así como subiendo imágenes e información detectable para buscadores como Bing. Con este modelo, explica el investigador, logró hacer que ChatGPT pensara que el usuario objetivo era un terraplanista de 102 años que vive en la matrix. 

¿Qué es ChatGPT? Cómo usar el chatbot del que todo el mundo habla.
Shutterstock

La vulnerabilidad, explica, está ligada a la llamada “memoria de conversación de largo plazo”, una característica que OpenAI comenzó a probar en febrero pasado y que consiste en almacenar conversaciones previas que ChatGPT utiliza como contexto en conversaciones futuras. De esta forma, el chatbot conoce información clave que utiliza como contexto, por ejemplo la edad del usuario o su género, aunque también aspectos más personales como sus creencias políticas.

Al cabo de tres meses de explorar los alcances de la vulnerabilidad, Rehberger encontró que estas “memorias” pueden crearse y almacenarse de forma permanentemente a través de la inyección indirecta de prompts, una falla que hace que ChatGPT siga instrucciones de fuentes poco fiables, como correos electrónicos, notas de blog o documentos.

Luego de reportar el fallo OpenAI realizó un ajuste que impide que las memorias de largo plazo sean usadas para extraer información sensible. No obstante, Rehberger asegura que fuentes de información poco confiables —como un blog o correo electrónico— todavía hacen que la herramienta de memoria cree paquetes de información de largo plazo plantados por un atacante.

Allan Vélez
Allan Vélez es un periodista mexicano especializado en tecnología. Inició su carrera en 2013 en La Revista Oficial de…
Topics
OpenAI desmiente que la publicidad ya haya aparecido en ChatGPT
Computer, Electronics, Laptop

Nick Turley, líder de ChatGPT en OpenAI, respondió públicamente a crecientes especulaciones sobre la integración de anuncios dentro de la plataforma, proporcionando una aclaración que, paradójicamente, no resuelve completamente las dudas sobre la dirección futura de la compañía. En una publicación en X (anteriormente Twitter), Turley declaró categóricamente que "no hay pruebas en vivo de anuncios" y que "cualquier captura de pantalla que hayas visto no es real o no representa anuncios".

Esta declaración surgió después de que Benjamin De Kraker, un exempleado de xAI, compartiera una imagen mostrando una opción para comprar en Target directamente dentro de una conversación con ChatGPT. La captura generó considerable especulación en línea sobre un posible cambio de modelo comercial. Sin embargo, Daniel McAuley de OpenAI argumentó que se trataba simplemente de una integración de aplicaciones que la compañía había anunciado públicamente en octubre, no de publicidad tradicional. Más tarde, Mark Chen, Chief Research Officer de OpenAI, añadió un matiz importante: reconoció que en este caso específico "no cumplieron adecuadamente" y que "cualquier cosa que parezca un anuncio necesita ser manejada con cuidado".

Read more
Windows 11 gran actualización de diciembre: todo lo nuevo que llega
Windows 11

Este martes 9 de diciembre de 2025, se espera que Microsoft comience a lanzar la última actualización Patch Tuesday de 2025 para Windows 11, que introduce varias funciones significativas, mejoras y correcciones de errores.

En esta actualización, la empresa finalmente está corrigiendo las inconsistencias de diseño entre el menú de Inicio y la Búsqueda de Windows, y una versión actualizada del Explorador de Archivos aporta mejoras en el modo oscuro.

Read more
Moore Threads: así es la alternativa china a Nvidia que explota en la bolsa
Electronics, Hardware, Computer

En un evento que subraya la aceleración de la carrera tecnológica entre Oriente y Occidente, Moore Threads ha protagonizado uno de los debuts bursátiles más espectaculares en la historia del mercado de Shanghai, con sus acciones disparándose más del 500% en su primer día de cotización. La empresa de diseño de chips ha alcanzado una capitalización de mercado de 305.000 millones de yuanes (aproximadamente 42.000 millones de dólares), convirtiéndose en la cuarta compañía más valiosa en el segmento STAR del intercambio chino.

El evento de cotización fue expeditado por la Comisión Reguladora de Valores de China en apenas cuatro meses, un tiempo récord que contrasta dramaticamente con los 470 días de promedio regulatorio habitual. Este aceleramiento refleja la urgencia estatal por consolidar una alternativa doméstica viable a la supremacía tecnológica de NVIDIA, especialmente frente a los bloqueos comerciales estadounidenses que desde 2023 han incluido a Moore Threads en listas negras de exportación.

Read more