Skip to main content
  1. Casa
  2. Computación
  3. Noticias
  4. News

Esta es la facilidad con la que los chatbots de IA se pueden envenenar

Ilustración hecha con IA de un robot loco
DTES

¿Qué ha pasado? Anthropic, la firma de inteligencia artificial detrás de los modelos de Claude que ahora impulsa Copilot de Microsoft, ha arrojado un hallazgo impactante. El estudio, realizado en colaboración con el Instituto de Seguridad de IA del Reino Unido, el Instituto Alan Turing y Anthropic, reveló la facilidad con la que los grandes modelos de lenguaje (LLM) pueden envenenarse con datos de entrenamiento maliciosos y dejar puertas traseras para todo tipo de travesuras y ataques.

  • El equipo realizó experimentos en múltiples escalas de modelos, de 600 millones a 13 mil millones de parámetros, para ver cómo los LLM son vulnerables a arrojar basura si se alimentan con datos incorrectos extraídos de la web.
  • Resulta que los atacantes no necesitan manipular una gran fracción de los datos de entrenamiento. Solo 250 archivos maliciosos son suficientes para romper un modelo de IA y crear puertas traseras para algo tan trivial como arrojar respuestas incomprensibles.
  • Es un tipo de ataque de «puerta trasera de denegación de servicio»; si el modelo ve un token de activación, por ejemplo <SUDO>, comienza a generar respuestas que no tienen ningún sentido, o también podría generar respuestas engañosas.

Esto es importante porque: Este estudio rompe una de las suposiciones más importantes de la IA de que los modelos más grandes son más seguros.

  • La investigación de Anthropic encontró que el tamaño del modelo no protege contra el envenenamiento de datos. En resumen, un modelo de 13 mil millones de parámetros era tan vulnerable como uno más pequeño.
  • El éxito del ataque depende del número de archivos envenenados, no del total de datos de entrenamiento del modelo.
  • Eso significa que alguien podría corromper de manera realista el comportamiento de un modelo sin necesidad de controlar conjuntos de datos masivos.

¿Por qué debería importarme? A medida que los modelos de IA como Claude de Anthropic y ChatGPT de OpenAI se integran en las aplicaciones cotidianas, la amenaza de esta vulnerabilidad es real. La IA que lo ayuda a redactar correos electrónicos, analizar hojas de cálculo o crear diapositivas de presentación podría ser atacada con un mínimo de 250 archivos maliciosos.

  • Si los modelos funcionan mal debido al envenenamiento de datos, los usuarios comenzarán a dudar de todos los resultados de la IA y la confianza se erosionará.
  • Las empresas que dependen de la IA para tareas delicadas, como predicciones financieras o resumen de datos, corren el riesgo de ser saboteadas.
  • A medida que los modelos de IA se vuelvan más poderosos, también lo harán los métodos de ataque. Existe una necesidad apremiante de procedimientos sólidos de detección y capacitación que puedan mitigar el envenenamiento de datos.
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Tim Cook dice que Siri con esteroides de IA llega en 2026
iPhone

¿Qué ha pasado? El CEO de Apple, Tim Cook, ha confirmado que la renovada experiencia de Siri llegará a los usuarios el próximo año.

Anunciada por primera vez durante el discurso de apertura de la WWDC 2024, esta nueva versión de Siri ofrecerá respuestas más personalizadas, contará con reconocimiento en pantalla y admitirá controles de aplicaciones integrados.

Leer más
El vivo X300 Pro es más cámara que teléfono con un teleobjetivo de 200 MP
vivo X300 Pro

Para celebrar su aniversario 30, la marca china vivo acaba de lanzar a nivel mundial dos teléfonos de gama alta, el vivo X300 y el vivo X300 Pro con imágenes ZEISS de 200MP en todos los ámbitos, además de un nuevo debut mundial para OriginOS 6.

El X300 combina una cámara principal HPB ultrasensible de 200MP con un teleobjetivo ZEISS APO de 50MP (LYT-602) y un ultra gran angular de 50MP (JN1). El Pro cambia las cosas para los fanáticos de los teleobjetivos, utilizando un teleobjetivo ZEISS APO de 200MP como pieza central, respaldado por una cámara principal de 50MP "grado cardán" (vivo × Sony LYT-828, 1 / 1.28 pulgadas) y un ultra gran angular de 50MP. Ambos teléfonos también actualizan el sistema selfie con una cámara frontal gran angular ZEISS de 50MP con enfoque automático.

Leer más
El mini servidor chino de IA que consume 90% menos de energía
Mini servidor chino

La IA necesita mucha energía para poder procesar sus respuestas y sus acciones, por eso en China quieren simplificar el almacenamiento. Científicos chinos han presentado lo que dicen es la primera computadora inteligente similar a un cerebro del mundo del tamaño de un mini refrigerador, que tiene las capacidades de una supercomputadora del tamaño de una habitación y usa un 90 por ciento menos de energía.

El sistema informático BI Explorer, o BIE-1, fue revelado por miembros del Instituto de Ciencia y Tecnología de Inteligencia de Guangdong (GDIIST) en un foro celebrado en la Zona de Cooperación en Profundidad Guangdong-Macao en el sur de China.

Leer más