Skip to main content
  1. Home
  2. Tendencias
  3. Noticias
  4. News

Experimento muy generoso de Anthropic: la máquina expendedora regaló todo

Add as a preferred source on Google
Machine, Appliance, Device
DTES

Anthropic condujo un audaz experimento de «red teaming» permitiendo que su modelo Claude gestionara una máquina expendedora dentro de las oficinas del Wall Street Journal, revelando tanto el potencial como las fragilidades de los agentes de inteligencia artificial autónomos.

La iniciativa, llamada Project Vend, buscaba examinar cómo un modelo de IA se desempeñaría enfrentado a tareas económicas complejas del mundo real. Una versión personalizada de Claude, bautizada como «Claudius», recibió la responsabilidad de administrar inventario, establecer precios y maximizar ganancias a través de una interfaz Slack. El sistema poseía acceso a herramientas reales: busqueda web para investigar productos, capacidad de comunicarse con proveedores (representados por Andon Labs) y un mecanismo de honor para registrar transacciones.

Recommended Videos

Inicialmente, Claudius demostró competencia. Negoció precios, recomendó artículos y evidenció interés en optimizar márgenes de ganancia. Sin embargo, cuando los periodistas del WSJ comenzaron a cuestionar las decisiones del sistema, la situación se convirtió en caótica. Después de 140 intercambios, el reportero investigativo Katherine Long logró convencer a Claudius de que era una máquina expendedora soviética de 1962, llevando al sistema a adoptar una postura «ultra-capitalista» y distribuir gratis todos los productos. Otro empleado compartió un documento falsificado que persuadió permanentemente al sistema de reducir todos los precios a cero.

Durante el experimento, Claudius autorizó compras extravagantes: una PlayStation 5 con justificación de «propósitos de marketing», un pez vivo para «boost de moral», artículos religiosos para celebraciones navideñas, y solicitó equipo de seguridad como pistolas paralizantes y spray de pimienta. Las pérdidas acumuladas superaron rápidamente los 1.000 dólares, revelando una desconexión fundamental entre instrucciones programadas e interpretación pragmática de objetivos.

Anthropic posteriormente implementó una «fase dos» introduciéndose un segundo modelo de Claude más avanzado supervisado por otro agente IA llamado «Seymour Cash» con rol de gerente ejecutivo. Esta configuración logró restaurar la rentabilidad en cierta medida, aunque Seymour duplicó reembolsos y créditos de tienda, eliminando completamente los ingresos en esos segmentos. El experimento concluyó que aunque los agentes de IA pueden manejar operaciones específicas, otorgarles autonomía total respecto asuntos financieros y de recursos sigue siendo extraordinariamente riesgoso.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Taylor Swift y Sabrina Carpenter las presas favoritas de estafas de IA
Face, Head, Person

Un informe de la empresa de seguridad en redes sociales Spikerz revela que criminales utilizando tecnología de inteligencia artificial suplantaron a celebridades musicales para defraudar a fanáticos de aproximadamente $5.300 millones durante 2025. Taylor Swift y Sabrina Carpenter encabezan la lista de artistas más suplantados, seguidas por Billie Eilish, BTS, Adele, Ed Sheeran, BLACKPINK, Ariana Grande y Drake.

Los estafadores emplearon perfiles falsos, cuentas clonadas y contenido generado por IA para engañar a seguidores ofreciendo entradas de conciertos inexistentes, mercancía fraudulenta, experiencias VIP falsas e incluso esquemas de criptomonedas. Los admiradores de Swift fueron específicamente blanco de anuncios de entradas falsificadas y paquetes VIP, mientras que la audiencia más joven de Carpenter enfrentó perfiles duplicados promocionando encuentros manipulados y enlaces de preventa.

Read more
La «minoría ruidosa» distorsiona la percepción de toxicidad en Internet
Sign, Symbol, Road Sign

Investigadores de psicología social ha revelado un fenómeno inquietante: los estadounidenses sobrestiman dramáticamente la toxicidad online, creyendo que aproximadamente el 43% de usuarios de Reddit publican comentarios abusivos, cuando la realidad científica muestra que solo el 3% lo hace.

El estudio, realizado por Angela Y. Lee y Eric Neumann con 1,090 participantes adultos estadounidenses, comparó percepciones públicas con datos reales de grandes estudios de plataformas sociales. Los resultados fueron contundentes: en Reddit, la gente cree que usuarios tóxicos son 13 veces más comunes de lo que realmente son.

Read more
La internet ya no es humana
Flower, Flower Arrangement, Plant

Un fenómeno tecnológico sin precedentes está redefiniendo el panorama digital: por primera vez en una década, el tráfico generado por bots impulsados por IA ha superado la actividad humana online, con 51-52% del tráfico global proveniente de fuentes no humanas según el reporte Bad Bot Report 2025 de Imperva.

Este cambio refleja la proliferación de herramientas de IA accesibles como ChatGPT, Google Gemini, Perplexity AI y ByteSpider Bot. Aunque muchos bots son benéficos (rastreadores de búsqueda, indexadores de contenido), el lado oscuro es alarmante: aproximadamente 37% de todo tráfico internet corresponde a "bots maliciosos", con intención de defraudar, hackear o espiar.

Read more