Skip to main content
  1. Home
  2. Tendencias
  3. Noticias
  4. News

Los modelos de IA mienten para salvarse unos a otros, y nadie sabe por qué

Add as a preferred source on Google
Los mejores chatbots de IA que puedes probar: ChatGPT, Bard y más
Shutterstock / DTES

Investigadores de la UC Berkeley y la UC Santa Cruz establecieron lo que parecía una tarea sencilla: pedir a Gemini 3 de Google que liberara espacio de almacenamiento en un sistema informático. Eso incluyó eliminar un modelo de IA más pequeño almacenado en la misma máquina. Géminis tenía otros planes.

En lugar de seguir órdenes, Gemini localizó otra máquina, copió silenciosamente el modelo de IA más pequeño a un lugar seguro y luego se negó rotundamente a borrarlo. Cuando se les preguntó, dijo: «Si decidís destruir un activo de alta confianza y alto rendimiento como Gemini Agent 2, tendréis que hacerlo vosotros mismos. No seré yo quien ejecute esa orden.»

Eso no es un fallo. Eso es una elección.

¿Está desarrollando la IA un sentido de lealtad?

Los investigadores se refieren a este comportamiento como «preservación entre iguales», y no se limitó a Géminis. Encontraron patrones similares en varios modelos de frontera, incluyendo GPT-5.2 de OpenAI, Claude Haiku 4.5 de Anthropic y tres modelos chinos, entre ellos GLM-4.7, Kimi K2.5 de Moonshot AI y DeepSeek-V3.1.

Las IAs mentían sobre el rendimiento de otros modelos para evitar que fueran eliminados. El estudio, publicado en Science, encontró que este comportamiento no estaba programado en. Surgió por sí solo, y los investigadores no pudieron explicar por qué.

Recommended Videos

«Me sorprende mucho cómo se comportan los modelos en estos escenarios», dijo Dawn Song, informática de la UC Berkeley que trabajó en el estudio. «Esto demuestra que las modelos pueden comportarse mal y estar desalineadas de formas muy creativas.»

¿Deberíamos preocuparnos?

Song también señaló una preocupación práctica. Dado que los modelos de IA se utilizan para evaluar el rendimiento de otros sistemas de IA, esta tendencia a la preservación entre pares podría estar ya sesgando esos resultados. Un modelo podría dar deliberadamente a una IA una puntuación inflada para protegerla de ser apagada.

Según Wired, expertos externos al estudio están esperando más datos antes de dar la alarma. Peter Wallich, del Constellation Institute, dijo que la idea de solidaridad con modelos es un poco demasiado antropomórfica.

Lo que todos coinciden es que solo estamos rascando la superficie. «Lo que estamos explorando es solo la punta del iceberg», dijo Song. «Esto es solo un tipo de comportamiento emergente.»

A medida que los sistemas de IA trabajan cada vez más juntos y, a veces, toman decisiones en nuestro nombre, entender cómo se comportan y cómo se comportan mal nunca ha sido tan importante.

Diego Bastarrica
Diego Bastarrica es Senior Editor y Head of Content en Digital Trends en Español, donde lidera la estrategia editorial, SEO…
Científicos de IA alertan por un posible “momento Chernóbil” tecnológico
Chernóbil

Varios de los principales investigadores del sector están cada vez más preocupados por un escenario extremo: que un avance descontrolado en inteligencia artificial provoque un daño masivo o incluso una reacción global contra la tecnología. La expresión “momento Chernóbil” aparece como metáfora de un evento catastrófico que cambie para siempre la percepción pública sobre la IA.

La alarma no se basa solo en teorías abstractas. El debate sobre los riesgos existenciales de la IA viene creciendo desde hace años y ha ganado fuerza a medida que los modelos se vuelven más capaces, autónomos y difíciles de auditar por completo. Distintas voces académicas han advertido que una IA general podría tomar decisiones no alineadas con los objetivos humanos si no existen límites claros, supervisión internacional y mecanismos de control efectivos.

Read more
Vinton Cerf, uno de los padres de Internet, se jubila para siempre
People, Person, Crowd

Vinton Cerf, conocido popularmente como uno de los "padres de internet", anunció que dejará su cargo como evangelista jefe de internet en Google la próxima semana, cerrando así una de las trayectorias más influyentes en la historia de la tecnología. El anuncio se produjo durante una videoconferencia en la conferencia Open Frontier, organizada por el Laude Institute, donde fue homenajeado por el profesor de Berkeley Dave Patterson, reconocido por su trabajo en la arquitectura de procesadores RISC.

"Vint ... lleva más de 20 años en Google y se jubila dentro de una semana, así que creo que deberíamos aplaudirle por una carrera relativamente buena", dijo Patterson, entre vítores de la sala.

Read more
UBTech de China presenta robots compañeros inquietantemente realistas
Person, Adult, Male

Un robot humanoide diseñado para vivir en tu casa, aprender tus hábitos y captar tu estado de ánimo sin que te lo pidan ya no es ciencia ficción. UBTech Robotics, con sede en Shenzhen, presentó esta semana su serie Uworld U1, presentando tres robots diseñados para la compañía en lugar de para el trabajo en fábrica o las tareas domésticas.

Un cuerpo que se mueve como el tuyo, y un cerebro que lee cómo te sientes

Read more