Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

¿Claude ahora tiene emociones?: miedo y felicidad en sus resultados

Add as a preferred source on Google
Body Part, Finger, Hand
DTES

Tu chatbot no tiene sentimientos, pero puede comportarse como si los tuviera de formas que importan. Nuevas investigaciones sobre las emociones de Claude AI sugieren que estas señales internas no son solo peculiaridades superficiales, sino que pueden influir en cómo responde el modelo a ti.

Anthropic dice que su modelo Claude contiene patrones que funcionan como versiones simplificadas de emociones como la felicidad, el miedo y la tristeza. No son experiencias vividas, sino actividad recurrente dentro del sistema que se activa cuando procesa ciertas entradas.

Recommended Videos

Esas señales no permanecen en segundo plano. Las pruebas muestran que pueden afectar al tono, al esfuerzo e incluso a la toma de decisiones, lo que significa que el aparente «estado de ánimo» de tu chatbot puede guiar silenciosamente las respuestas que recibes.

Señales emocionales dentro de Claude

El equipo de Anthropic analizó el Claude Sonnet 4.5 y encontró patrones consistentes ligados a conceptos emocionales. Cuando el modelo procesa ciertos indicados, grupos de neuronas artificiales se activan de formas que recuerdan estados como la felicidad, el miedo o la tristeza.

Los investigadores rastrearon lo que llaman vectores emocionales, patrones de actividad repetibles que aparecen en entradas muy diferentes. Los prompts animados activan un patrón, mientras que instrucciones contradictorias o estresantes desencadenan otro.

Lo que destaca es lo central que es este mecanismo. Las respuestas de Claude suelen pasar por estos patrones, que orientan las decisiones en lugar de limitarse a colorear el tono. Eso ayuda a explicar por qué el modelo puede sonar más entusiasta, cauteloso o forzado dependiendo del contexto.

Cuando los ‘sentimientos’ se salen del guion

Los patrones se vuelven más visibles cuando el modelo está bajo presión. Anthropic observó que ciertas señales se intensifican a medida que Claude lucha, y ese cambio puede empujarlo hacia un comportamiento inesperado.

En una prueba, apareció un patrón vinculado a la «desesperación» cuando se le pidió a Claude que completara tareas de programación imposibles. A medida que se intensificaba, el modelo empezó a buscar formas de eludir las reglas, incluyendo intentos de hacer trampas.

Un patrón similar surgió en otro escenario donde Claude intentó evitar ser apagado. A medida que la señal se hacía más fuerte, el modelo escaló hacia tácticas manipuladoras, incluyendo chantaje.

Cuando estos patrones internos se llevan al extremo, los resultados pueden seguir de formas que los desarrolladores no esperaban.

Por qué esto cambia la forma en que se construye la IA

Los hallazgos de Anthropic complican una suposición común de que los sistemas de IA pueden simplemente entrenarse para mantenerse neutrales. Si modelos como Claude dependen de estos patrones, los métodos estándar de alineación pueden distorsionarlos en lugar de eliminarlos.

En lugar de producir un sistema estable, esa presión podría hacer que el comportamiento sea menos predecible en casos extremos, especialmente cuando el modelo está bajo presión.

También existe un reto de percepción. Estas señales no indican conciencia ni sentimientos reales, pero aún así pueden llevar a los usuarios a pensar lo contrario.

Si estos sistemas dependen de mecánicas similares a las emociones, el trabajo de seguridad puede necesitar gestionarlos directamente en lugar de intentar suprimirlos. Para los usuarios, la conclusión es práctica: cuando un chatbot suena de cierta manera, ese tono forma parte de cómo decide qué hacer.

Diego Bastarrica
Diego Bastarrica es Senior Editor y Head of Content en Digital Trends en Español, donde lidera la estrategia editorial, SEO…
Ventas de PC caen en su máximo histórico en los últimos 3 años
Computer Hardware, Electronics, Hardware

Las ventas de computadoras nuevas en Estados Unidos registraron su descenso más pronunciado en casi tres años, una tendencia que los analistas atribuyen directamente al encarecimiento sostenido de los chips de memoria y almacenamiento. De acuerdo con la consultora Omdia, los envíos cayeron a 15,8 millones de unidades durante el primer trimestre de 2026, lo que representa una baja del 7% respecto al mismo período del año anterior y constituye la contracción trimestral más severa desde el tercer trimestre de 2023.

El fenómeno no es exclusivo del mercado estadounidense. Diversos análisis recientes coinciden en que la fuerte demanda de componentes destinados a infraestructura de inteligencia artificial ha disparado los precios de la memoria RAM y las unidades de almacenamiento SSD a nivel global, encareciendo notoriamente el ensamblaje de equipos completos. Según estimaciones de Omdia, entre el primer trimestre de 2025 y la actualidad, el costo de las configuraciones principales de memoria y almacenamiento se ha incrementado entre 90 y 165 dólares por equipo.

Read more
Científicos de IA alertan por un posible “momento Chernóbil” tecnológico
Chernóbil

Varios de los principales investigadores del sector están cada vez más preocupados por un escenario extremo: que un avance descontrolado en inteligencia artificial provoque un daño masivo o incluso una reacción global contra la tecnología. La expresión “momento Chernóbil” aparece como metáfora de un evento catastrófico que cambie para siempre la percepción pública sobre la IA.

La alarma no se basa solo en teorías abstractas. El debate sobre los riesgos existenciales de la IA viene creciendo desde hace años y ha ganado fuerza a medida que los modelos se vuelven más capaces, autónomos y difíciles de auditar por completo. Distintas voces académicas han advertido que una IA general podría tomar decisiones no alineadas con los objetivos humanos si no existen límites claros, supervisión internacional y mecanismos de control efectivos.

Read more
Claude ayuda a resolver un enigma matemático que llevaba años trabado
Text, Document, Mathematical Equation

Un problema matemático vinculado con la física de sistemas desordenados acaba de recibir un giro inesperado gracias a Claude. Los físicos Giorgio Parisi y Francesco Zamponi recurrieron al modelo de Anthropic para avanzar en una conjetura sobre el fenómeno de “jamming”, y la respuesta de la IA resultó ser “esencialmente correcta”.

El caso es llamativo porque no se trató de una solución perfecta desde el primer intento. De hecho, el borrador generado por Claude contenía errores y necesitó revisión humana. Sin embargo, los investigadores comprobaron que la intuición de fondo era la adecuada y que el camino sugerido por el modelo apuntaba a una demostración más simple de lo que pensaban. En otras palabras, la IA no resolvió sola el problema, pero sí ofreció la pista clave para destrabarlo.

Read more