Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

Esta es la facilidad con la que los chatbots de IA se pueden envenenar

Add as a preferred source on Google
Ilustración hecha con IA de un robot loco
DTES

¿Qué ha pasado? Anthropic, la firma de inteligencia artificial detrás de los modelos de Claude que ahora impulsa Copilot de Microsoft, ha arrojado un hallazgo impactante. El estudio, realizado en colaboración con el Instituto de Seguridad de IA del Reino Unido, el Instituto Alan Turing y Anthropic, reveló la facilidad con la que los grandes modelos de lenguaje (LLM) pueden envenenarse con datos de entrenamiento maliciosos y dejar puertas traseras para todo tipo de travesuras y ataques.

  • El equipo realizó experimentos en múltiples escalas de modelos, de 600 millones a 13 mil millones de parámetros, para ver cómo los LLM son vulnerables a arrojar basura si se alimentan con datos incorrectos extraídos de la web.
  • Resulta que los atacantes no necesitan manipular una gran fracción de los datos de entrenamiento. Solo 250 archivos maliciosos son suficientes para romper un modelo de IA y crear puertas traseras para algo tan trivial como arrojar respuestas incomprensibles.
  • Es un tipo de ataque de «puerta trasera de denegación de servicio»; si el modelo ve un token de activación, por ejemplo <SUDO>, comienza a generar respuestas que no tienen ningún sentido, o también podría generar respuestas engañosas.

Esto es importante porque: Este estudio rompe una de las suposiciones más importantes de la IA de que los modelos más grandes son más seguros.

  • La investigación de Anthropic encontró que el tamaño del modelo no protege contra el envenenamiento de datos. En resumen, un modelo de 13 mil millones de parámetros era tan vulnerable como uno más pequeño.
  • El éxito del ataque depende del número de archivos envenenados, no del total de datos de entrenamiento del modelo.
  • Eso significa que alguien podría corromper de manera realista el comportamiento de un modelo sin necesidad de controlar conjuntos de datos masivos.

¿Por qué debería importarme? A medida que los modelos de IA como Claude de Anthropic y ChatGPT de OpenAI se integran en las aplicaciones cotidianas, la amenaza de esta vulnerabilidad es real. La IA que lo ayuda a redactar correos electrónicos, analizar hojas de cálculo o crear diapositivas de presentación podría ser atacada con un mínimo de 250 archivos maliciosos.

  • Si los modelos funcionan mal debido al envenenamiento de datos, los usuarios comenzarán a dudar de todos los resultados de la IA y la confianza se erosionará.
  • Las empresas que dependen de la IA para tareas delicadas, como predicciones financieras o resumen de datos, corren el riesgo de ser saboteadas.
  • A medida que los modelos de IA se vuelvan más poderosos, también lo harán los métodos de ataque. Existe una necesidad apremiante de procedimientos sólidos de detección y capacitación que puedan mitigar el envenenamiento de datos.
Diego Bastarrica
Diego Bastarrica es Senior Editor y Head of Content en Digital Trends en Español, donde lidera la estrategia editorial, SEO…
OpenAI ofrecería al gobierno de EE.UU. una participación del 5%
Sam Altman

OpenAI propuso entregar al gobierno de Estados Unidos una participación accionaria del 5% en la compañía, según reveló el Financial Times este jueves. Dicha porción equivaldría a unos USD 42,600 millones, tomando como referencia la valorización de USD 852,000 millones que alcanzó la empresa tras su ronda de financiamiento de marzo.

El director ejecutivo Sam Altman planteó que otorgar al público un interés financiero directo en la compañía sería la mejor manera de compartir los beneficios derivados de la inteligencia artificial. La propuesta, discutida en etapas preliminares con la administración Trump, contemplaría que Washington reciba un 5% de cada uno de los principales desarrolladores estadounidenses de IA a través de un vehículo gubernamental similar a un fondo soberano.

Read more
Las reseñas engañosas de IA de TripAdvisor pueden arruinar tu viaje
Computer, Electronics, Laptop

Planificar un viaje ya es bastante estresante sin preguntarse si el resumen tan brillante del hotel que acabas de leer fue escrito por una IA que se saltó las partes aterradoras. Resulta que eso podría ser exactamente lo que está ocurriendo en TripAdvisor.

Según una investigación del grupo de consumidores Which?, informada por The Guardian, los resúmenes de reseñas generados por IA por TripAdvisor están suavizando quejas graves de los huéspedes y, en algunos casos, incluso peligrosas.

Read more
Ventas de PC caen en su máximo histórico en los últimos 3 años
Computer Hardware, Electronics, Hardware

Las ventas de computadoras nuevas en Estados Unidos registraron su descenso más pronunciado en casi tres años, una tendencia que los analistas atribuyen directamente al encarecimiento sostenido de los chips de memoria y almacenamiento. De acuerdo con la consultora Omdia, los envíos cayeron a 15,8 millones de unidades durante el primer trimestre de 2026, lo que representa una baja del 7% respecto al mismo período del año anterior y constituye la contracción trimestral más severa desde el tercer trimestre de 2023.

El fenómeno no es exclusivo del mercado estadounidense. Diversos análisis recientes coinciden en que la fuerte demanda de componentes destinados a infraestructura de inteligencia artificial ha disparado los precios de la memoria RAM y las unidades de almacenamiento SSD a nivel global, encareciendo notoriamente el ensamblaje de equipos completos. Según estimaciones de Omdia, entre el primer trimestre de 2025 y la actualidad, el costo de las configuraciones principales de memoria y almacenamiento se ha incrementado entre 90 y 165 dólares por equipo.

Read more