Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

DT en Español podría recibir una comisión si compras un producto desde el sitio

Es posible que el 57% de Internet ya sea solo contenido hecho con IA

Una burbuja de palabras CGI
Google Deepmind / Pexels

No eres solo tú, los resultados de búsqueda realmente están empeorando. Los investigadores de Amazon Web Services (AWS) han realizado un estudio que sugiere que el 57% del contenido en Internet hoy en día es generado por IA o traducido utilizando un algoritmo de IA.

El estudio, titulado «A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way Parallelism«, argumenta que la traducción automática (TA) de bajo costo, que toma un determinado fragmento de contenido y lo regurgita en varios idiomas, es la principal culpable. «Las traducciones paralelas multidireccionales generadas por máquinas no solo dominan la cantidad total de contenido traducido en la web en idiomas de bajos recursos donde la traducción automática está disponible; También constituye una gran fracción del contenido web total en esos idiomas», escribieron los investigadores en el estudio.

Recommended Videos

También encontraron evidencia de sesgo de selección en qué contenido se traduce automáticamente a varios idiomas en comparación con el contenido publicado en un solo idioma. «Este contenido es más corto, más predecible y tiene una distribución temática diferente en comparación con el contenido traducido a un solo idioma», escribieron los investigadores.

Además, la creciente cantidad de contenido generado por IA en Internet, combinado con la creciente dependencia de las herramientas de IA para editar y manipular ese contenido, podría conducir a un fenómeno conocido como colapso del modelo, y ya está reduciendo la calidad de los resultados de búsqueda en la web. Dado que los modelos de IA de frontera como ChatGPT, Gemini y Claude dependen de cantidades masivas de datos de entrenamiento que solo se pueden adquirir raspando la web pública (ya sea que viole los derechos de autor o no), tener la web pública llena de contenido generado por IA, y a menudo inexacto, podría degradar gravemente su rendimiento.

«Es sorprendente lo rápido que se produce el colapso del modelo y lo difícil que puede ser», dijo el Dr. Ilia Shumailov de la Universidad de Oxford a Windows Central. «Al principio, afecta a los datos de las minorías, a los datos que están mal representados. A continuación, afecta a la diversidad de las salidas y la varianza se reduce. A veces, se observa una pequeña mejora en los datos de la mayoría, que oculta la degradación del rendimiento de los datos de las minorías. El colapso del modelo puede tener graves consecuencias».

Los investigadores demostraron esas consecuencias haciendo que lingüistas profesionales clasificaran 10.000 oraciones en inglés seleccionadas al azar de una de las 20 categorías. Los investigadores observaron «un cambio dramático en la distribución de los temas al comparar los datos paralelos de 2 vías a 8+ (es decir, el número de traducciones de idiomas), con temas de ‘conversación y opinión’ que aumentaron del 22,5% al 40,1%» de los publicados.

Esto apunta a un sesgo de selección en el tipo de datos que se traducen a varios idiomas, que es «sustancialmente más probable» que provengan del tema de «conversación y opinión».

Además, los investigadores descubrieron que «las traducciones paralelas altamente multidireccionales son significativamente de menor calidad (6,2 puntos de estimación de calidad del cometa peores) que las traducciones paralelas de 2 vías». Cuando los investigadores auditaron 100 de las oraciones paralelas altamente multidireccionales (aquellas traducidas a más de ocho idiomas), encontraron que «una gran mayoría» provenía de granjas de contenido con artículos «que caracterizamos como de baja calidad, que requerían poca o ninguna experiencia, o esfuerzo previo para crear».

Eso ciertamente ayuda a explicar por qué el CEO de OpenAI, Sam Altman, sigue insistiendo en que es «imposible» hacer herramientas como ChatGPT sin acceso libre a obras con derechos de autor.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Adobe entrega una herramienta esencial para Youtube Shorts
Art, Collage, Animal

Adobe ha anunciado una estrategia ambiciosa para consolidarse en el mercado de la edición de video móvil, estrechando lazos con YouTube mediante el lanzamiento de un espacio dedicado dentro de Premiere Mobile para los creadores de Shorts. Esta iniciativa representa un movimiento táctico significativo en el panorama competitivo de las herramientas de creación de contenido, donde gigantes como CapCut y Meta Edits han ganado terreno acelerado en los últimos años.

El nuevo centro de creación "Create for YouTube" se presenta como una solución integral diseñada específicamente para quienes desean producir contenido viral optimizado para la plataforma de Google. Los usuarios tendrán acceso a plantillas exclusivas curadas por creadores de alto rendimiento, transiciones profesionales y efectos visuales preconfigurados, junto con la capacidad de publicar directamente en sus canales de YouTube sin necesidad de cambiar de aplicación. Este flujo de trabajo simplificado busca reducir la fricción que actualmente experimentan los creadores que utilizan herramientas alternativas.

Read more
OpenAI desmiente que la publicidad ya haya aparecido en ChatGPT
Computer, Electronics, Laptop

Nick Turley, líder de ChatGPT en OpenAI, respondió públicamente a crecientes especulaciones sobre la integración de anuncios dentro de la plataforma, proporcionando una aclaración que, paradójicamente, no resuelve completamente las dudas sobre la dirección futura de la compañía. En una publicación en X (anteriormente Twitter), Turley declaró categóricamente que "no hay pruebas en vivo de anuncios" y que "cualquier captura de pantalla que hayas visto no es real o no representa anuncios".

Esta declaración surgió después de que Benjamin De Kraker, un exempleado de xAI, compartiera una imagen mostrando una opción para comprar en Target directamente dentro de una conversación con ChatGPT. La captura generó considerable especulación en línea sobre un posible cambio de modelo comercial. Sin embargo, Daniel McAuley de OpenAI argumentó que se trataba simplemente de una integración de aplicaciones que la compañía había anunciado públicamente en octubre, no de publicidad tradicional. Más tarde, Mark Chen, Chief Research Officer de OpenAI, añadió un matiz importante: reconoció que en este caso específico "no cumplieron adecuadamente" y que "cualquier cosa que parezca un anuncio necesita ser manejada con cuidado".

Read more
Windows 11 gran actualización de diciembre: todo lo nuevo que llega
Windows 11

Este martes 9 de diciembre de 2025, se espera que Microsoft comience a lanzar la última actualización Patch Tuesday de 2025 para Windows 11, que introduce varias funciones significativas, mejoras y correcciones de errores.

En esta actualización, la empresa finalmente está corrigiendo las inconsistencias de diseño entre el menú de Inicio y la Búsqueda de Windows, y una versión actualizada del Explorador de Archivos aporta mejoras en el modo oscuro.

Read more