Claude AI detendrá las «interacciones dañinas o abusivas de los usuarios»

By Diego Bastarrica Published agosto 18, 2025

Claude — DTES

La IA está tomando sus propias medidas para autocensurarse cuando las conversaciones se vayan un poco de las manos o al menos es lo que está tratando de incorporar Anthropic con Claude AI.

El chatbot ahora puede poner fin a conversaciones consideradas «persistentemente dañinas o abusivas», como lo detectó TechCrunch. La capacidad ahora está disponible en los modelos Opus 4 y 4.1, y permitirá que el chatbot finalice las conversaciones como «último recurso» después de que los usuarios le pidan repetidamente que genere contenido dañino a pesar de múltiples rechazos e intentos de redirección. El objetivo es ayudar al «bienestar potencial» de los modelos de IA, dice Anthropic, al terminar con los tipos de interacciones en las que Claude ha mostrado «angustia aparente».

Recommended Videos

Si Claude elige interrumpir una conversación, los usuarios no podrán enviar nuevos mensajes en esa conversación. Aún pueden crear nuevos chats, así como editar y volver a intentar mensajes anteriores si desean continuar un hilo en particular.

Durante sus pruebas de Claude Opus 4, Anthropic dice que descubrió que Claude tenía una «aversión robusta y consistente al daño», incluso cuando se le pedía que generara contenido sexual que involucrara a menores o proporcionara información que pudiera contribuir a actos violentos y terrorismo. En estos casos, Anthropic dice que Claude mostró un «patrón de angustia aparente» y una «tendencia a terminar conversaciones dañinas cuando se le dio la capacidad».

de respuesta son «casos extremos extremos», y agrega que la mayoría de los usuarios no encontrarán este obstáculo incluso cuando chateen sobre temas controvertidos. La startup de IA también ha dado instrucciones a Claude para que no termine las conversaciones si un usuario muestra signos de que podría querer lastimarse a sí mismo o causar un «daño inminente» a otros.

Diego Bastarrica

Senior Editor

Diego Bastarrica es Senior Editor y Head of Content en Digital Trends en Español, donde lidera la estrategia editorial, SEO…

Topics

Computación

Ventas de PC caen en su máximo histórico en los últimos 3 años

Computer Hardware, Electronics, Hardware

Las ventas de computadoras nuevas en Estados Unidos registraron su descenso más pronunciado en casi tres años, una tendencia que los analistas atribuyen directamente al encarecimiento sostenido de los chips de memoria y almacenamiento. De acuerdo con la consultora Omdia, los envíos cayeron a 15,8 millones de unidades durante el primer trimestre de 2026, lo que representa una baja del 7% respecto al mismo período del año anterior y constituye la contracción trimestral más severa desde el tercer trimestre de 2023.

El fenómeno no es exclusivo del mercado estadounidense. Diversos análisis recientes coinciden en que la fuerte demanda de componentes destinados a infraestructura de inteligencia artificial ha disparado los precios de la memoria RAM y las unidades de almacenamiento SSD a nivel global, encareciendo notoriamente el ensamblaje de equipos completos. Según estimaciones de Omdia, entre el primer trimestre de 2025 y la actualidad, el costo de las configuraciones principales de memoria y almacenamiento se ha incrementado entre 90 y 165 dólares por equipo.

Computación

Científicos de IA alertan por un posible “momento Chernóbil” tecnológico

Chernóbil

Varios de los principales investigadores del sector están cada vez más preocupados por un escenario extremo: que un avance descontrolado en inteligencia artificial provoque un daño masivo o incluso una reacción global contra la tecnología. La expresión “momento Chernóbil” aparece como metáfora de un evento catastrófico que cambie para siempre la percepción pública sobre la IA.

La alarma no se basa solo en teorías abstractas. El debate sobre los riesgos existenciales de la IA viene creciendo desde hace años y ha ganado fuerza a medida que los modelos se vuelven más capaces, autónomos y difíciles de auditar por completo. Distintas voces académicas han advertido que una IA general podría tomar decisiones no alineadas con los objetivos humanos si no existen límites claros, supervisión internacional y mecanismos de control efectivos.

Computación

Claude ayuda a resolver un enigma matemático que llevaba años trabado

Text, Document, Mathematical Equation

Un problema matemático vinculado con la física de sistemas desordenados acaba de recibir un giro inesperado gracias a Claude. Los físicos Giorgio Parisi y Francesco Zamponi recurrieron al modelo de Anthropic para avanzar en una conjetura sobre el fenómeno de “jamming”, y la respuesta de la IA resultó ser “esencialmente correcta”.

El caso es llamativo porque no se trató de una solución perfecta desde el primer intento. De hecho, el borrador generado por Claude contenía errores y necesitó revisión humana. Sin embargo, los investigadores comprobaron que la intuición de fondo era la adecuada y que el camino sugerido por el modelo apuntaba a una demostración más simple de lo que pensaban. En otras palabras, la IA no resolvió sola el problema, pero sí ofreció la pista clave para destrabarlo.