Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Es posible que el 57% de Internet ya sea solo contenido hecho con IA

Una burbuja de palabras CGI
Google Deepmind / Pexels

No eres solo tú, los resultados de búsqueda realmente están empeorando. Los investigadores de Amazon Web Services (AWS) han realizado un estudio que sugiere que el 57% del contenido en Internet hoy en día es generado por IA o traducido utilizando un algoritmo de IA.

El estudio, titulado «A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way Parallelism«, argumenta que la traducción automática (TA) de bajo costo, que toma un determinado fragmento de contenido y lo regurgita en varios idiomas, es la principal culpable. «Las traducciones paralelas multidireccionales generadas por máquinas no solo dominan la cantidad total de contenido traducido en la web en idiomas de bajos recursos donde la traducción automática está disponible; También constituye una gran fracción del contenido web total en esos idiomas», escribieron los investigadores en el estudio.

Recommended Videos

También encontraron evidencia de sesgo de selección en qué contenido se traduce automáticamente a varios idiomas en comparación con el contenido publicado en un solo idioma. «Este contenido es más corto, más predecible y tiene una distribución temática diferente en comparación con el contenido traducido a un solo idioma», escribieron los investigadores.

Además, la creciente cantidad de contenido generado por IA en Internet, combinado con la creciente dependencia de las herramientas de IA para editar y manipular ese contenido, podría conducir a un fenómeno conocido como colapso del modelo, y ya está reduciendo la calidad de los resultados de búsqueda en la web. Dado que los modelos de IA de frontera como ChatGPT, Gemini y Claude dependen de cantidades masivas de datos de entrenamiento que solo se pueden adquirir raspando la web pública (ya sea que viole los derechos de autor o no), tener la web pública llena de contenido generado por IA, y a menudo inexacto, podría degradar gravemente su rendimiento.

«Es sorprendente lo rápido que se produce el colapso del modelo y lo difícil que puede ser», dijo el Dr. Ilia Shumailov de la Universidad de Oxford a Windows Central. «Al principio, afecta a los datos de las minorías, a los datos que están mal representados. A continuación, afecta a la diversidad de las salidas y la varianza se reduce. A veces, se observa una pequeña mejora en los datos de la mayoría, que oculta la degradación del rendimiento de los datos de las minorías. El colapso del modelo puede tener graves consecuencias».

Los investigadores demostraron esas consecuencias haciendo que lingüistas profesionales clasificaran 10.000 oraciones en inglés seleccionadas al azar de una de las 20 categorías. Los investigadores observaron «un cambio dramático en la distribución de los temas al comparar los datos paralelos de 2 vías a 8+ (es decir, el número de traducciones de idiomas), con temas de ‘conversación y opinión’ que aumentaron del 22,5% al 40,1%» de los publicados.

Esto apunta a un sesgo de selección en el tipo de datos que se traducen a varios idiomas, que es «sustancialmente más probable» que provengan del tema de «conversación y opinión».

Además, los investigadores descubrieron que «las traducciones paralelas altamente multidireccionales son significativamente de menor calidad (6,2 puntos de estimación de calidad del cometa peores) que las traducciones paralelas de 2 vías». Cuando los investigadores auditaron 100 de las oraciones paralelas altamente multidireccionales (aquellas traducidas a más de ocho idiomas), encontraron que «una gran mayoría» provenía de granjas de contenido con artículos «que caracterizamos como de baja calidad, que requerían poca o ninguna experiencia, o esfuerzo previo para crear».

Eso ciertamente ayuda a explicar por qué el CEO de OpenAI, Sam Altman, sigue insistiendo en que es «imposible» hacer herramientas como ChatGPT sin acceso libre a obras con derechos de autor.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Quieren ser el próximo Bliss: en la busca del fondo de pantalla perfecto para Windows
fondo pantalla perfecto windows microsoft presenta una version en 4k del legendario de bliss xp 1

Fue en 2001 cuando un fondo de pantalla y un sistema operativo se juntaron para siempre en el imaginario colectivo: Bliss y Windows XP.

La historia del fondo de pantalla "Bliss", conocido por ser el icónico fondo de escritorio de Windows XP, comienza con una fotografía capturada por Charles O'Rear en 1996. O'Rear, un fotógrafo que colaboró con National Geographic, tomó la imagen en el Valle de Napa, California, mientras buscaba la composición perfecta para un proyecto de escritorio. La foto muestra colinas onduladas y un cielo azul sin nubes, y fue tomada con una cámara Mamiya RZ67.

Leer más
¿Cómo borrar todo de un SSD o un disco duro?
Cómo destruir un disco duro

Borrar toda tu información de un SSD (una unidad de estado sólido) o un disco duro es un proceso crucial, especialmente si estás por vender tu laptop o PC. Y decimos crucial porque, sin las herramientas necesarias, el nuevo dueño o dueña de tu laptop podría dar con información confidencial, que en el peor de los casos, podría ser una fuente bastante rica para comerte algún tipo de fraude. Por ejemplo, un disco duro puede mantener información sobre las páginas web que visitas, incluidas las de servicios bancarios o financieros. Así que, por si acaso, lo mejor es saber cómo borrar todo de un SSD o un disco duro. Para tu fortuna, el proceso es bastante sencillo.
¿Cómo borrar todo de un SSD?
Es muy probable que la laptop o PC que utilices almacene el sistema operativo en una unidad de estado sólido o SSD (siglas de solid state drive). Si es tu caso sonríe, pues borrar todo de un SSD es un proceso mucho más sencillo que hacerlo de un HDD (un disco duro o hard disk drive) y solo necesitas la aplicación Administración de discos incluida en Windows.

Toma en cuenta que para borrar toda la información alojada en un SSD necesitas tener Windows instalado en otra unidad (otro SSD por ejemplo), pues Windows no puede borrarse a sí mismo, a menos, claro, que reinstales Windows usando un disco de arranque como una USB.

Leer más
Esta aplicación de duplicación de fps es incluso mejor que DLSS 3
lossless scaling aplicacion duplicacion fps

Lossless Scaling es una aplicación de Steam de 7 dólares que ha dado la vuelta a la idea de la generación de fotogramas este año. Al igual que herramientas como DLSS 3 de Nvidia y FSR 3 de AMD, Lossless Scaling ofrece generación de fotogramas. Sin embargo, funciona con cualquier juego y con cualquier tarjeta gráfica, y puede triplicar o cuadruplicar la velocidad de fotogramas con esta generación de fotogramas. Y ahora, la aplicación va más allá con una función que incluso DLSS 3 y FSR 3 no tienen.

El desarrollador publicó la versión beta 2.12 en Steam el miércoles y agrega un par de características nuevas. La más importante es una escala de resolución para LSFG, el algoritmo de generación de fotogramas basado en el aprendizaje automático de la herramienta. Esto le permite disminuir la resolución de los fotogramas de entrada, lo que lleva a una pérdida de calidad muy pequeña a cambio de un aumento de rendimiento bastante grande. La resolución del juego no cambia en absoluto. Básicamente, le estás dando al algoritmo de generación de fotogramas un poco menos de información con la que trabajar.

Leer más