La IA generativa acaba de superar un nuevo nivel de creatividad, al menos para la persona promedio. Este estudio sobre creatividad en IA comparó resultados de más de 100.000 personas con varios modelos de lenguaje grandes, incluyendo ChatGPT, Claude y Gemini, y encontró que algunos modelos pueden superar a un humano típico en una tarea de creatividad estandarizada.
Pero el techo sigue pareciendo humano. El estudio informa que la mitad más creativa de los participantes superó a todos los modelos de IA probados, y el 10% superior amplió aún más la ventaja.
La IA mejora en completar tareas creativas básicas, mientras que una producción humana excepcional mantiene una brecha difícil de eliminar.
La prueba detrás de la afirmación
Los investigadores se apoyaron en la Tarea de Asociación Divergente, un prompt rápido que pide diez palabras lo menos relacionadas posible. Las puntuaciones suben cuando esas palabras están más semánticamente distantes, y la mayoría termina en pocos minutos.
Esa simplicidad es la razón por la que el equipo pudo hacer una comparación tan grande. También ayuda a explicar el resultado principal: los modelos pueden ajustarse para generar elecciones de palabras variadas bajo demanda, lo que se corresponde perfectamente con lo que recompensa el DAT.
Aun así, el DAT mide una porción de creatividad, la capacidad de producir lenguaje divergente. No mide el gusto, el impacto emocional ni si una idea es la adecuada para un público específico.
Donde los humanos mantienen una ventaja
La señal más fuerte en los hallazgos no es un único ganador, es el margen. Algunos sistemas de IA pueden superar a la media, pero los humanos con alta puntuación se separan, y la diferencia crece en la parte alta.
En el día a día, los modelos destacan en volumen. Si necesitas diez direcciones rápidas, puede cumplir. Lo que no puede hacer de forma fiable es la parte selectiva, eligiendo la única dirección que merece la pena seguir, moldeándola según las limitaciones y haciendo que parezca intencionada en lugar de meramente plausible.
Por eso también el resultado no debe interpretarse como un veredicto sobre las carreras creativas. El benchmark muestra el rango de ideación. No muestra juicio bajo presión, ni el tipo de originalidad que cambia lo que espera el público.
Qué hacer con él
El equipo también comparó a personas y modelos en tareas de estilo escritura creativa, incluyendo haikues, resúmenes de tramas y relatos cortos, lo que se parece más a cómo muchas personas usan ChatGPT. Incluso allí, los principales creadores humanos mantuvieron la ventaja.
Si usas IA en el trabajo, trátala como un acelerador de ideación. Úsalo para generar amplitud, luego aplica la parte que aún os diferencia, decide qué encaja con tu voz, qué encaja con el brief y qué merece la pena enviar.
Estate atento a las siguientes que concretan versiones exactas de modelos y fechas de prueba, porque este tipo de clasificación puede avanzar rápidamente a medida que cambian de modelos.