Skip to main content

Acusan a Meta de entrenar su IA pirateando libros en Torrent

Después de que Meta anunciara el fin de la moderación en sus plataformas, ahora se le sobrevino un nuevo problema, ya que una investigación de Wired y también del medio británico The Guardian, dan cuenta de que la compañía de Mark Zuckerberg estaba usando libros descargados de manera pirata de servidores torrent.

Mark Zuckerberg Meta
DTES

Documentos judiciales recientemente no editados alegan que Meta, el archivo en línea Library Genesis para entrenar sus modelos de IA, informa Wired.

Recommended Videos

En una demanda en curso presentada contra la plataforma por un grupo de autores, incluidos Ta-Nehisi Coates y la comediante Sarah Silverman, los documentos finalmente se publicaron en su totalidad después de que un juez rechazara los intentos de Meta de mantener partes de ellos selladas.

El juez argumentó, según Wired, que Meta luchó por las redacciones simplemente para «evitar publicidad negativa», citando una cita interna condenatoria de uno de sus empleados.

«Si hay cobertura mediática que sugiere que hemos utilizado un conjunto de datos que sabemos que es pirateado, como LibGen, esto puede socavar nuestra posición negociadora con los reguladores sobre estos temas», escribió el empleado de Meta no identificado.

¿Cuál es el argumento que quiere usar Meta?

Library Genesis, o LibGen, es una «biblioteca en la sombra» que proporciona acceso gratuito a millones de libros, artículos académicos y revistas.

Meta y otros líderes de IA argumentan que el uso de libros y otros datos extraídos de la web constituye un «uso justo», pero en última instancia dependerá de batallas legales como esta determinar si ese es el caso.

Con un emoji sonriente, un ingeniero escribió: «Descargar torrents desde una computadora portátil corporativa [propiedad de Meta] no se siente bien», según lo citado por Wired.

Y llega hasta la cima. Un memorándum citado supuestamente muestra que después de que las discusiones de los empleados sobre el uso de LibGen se intensificaran a «MZ» (el CEO de Meta, Mark Zuckerberg), el equipo de IA fue «aprobado para usar» material de la base de datos.

«Meta ha tratado la llamada ‘disponibilidad pública’ de los conjuntos de datos en la sombra como una carta para salir de la cárcel, a pesar de que los registros internos de Meta muestran que todos los responsables de la toma de decisiones relevantes en Meta, incluido su CEO, Mark Zuckerberg, sabían que LibGen era ‘un conjunto de datos que sabemos que es pirateado'», escribieron en la moción más reciente los demandantes.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Reddit tendrá su propio buscador de IA para rivalizar con Google
Los mejores subreddits que puedes encontrar en Reddit.

La IA está haciendo que la brecha de las búsquedas se acorte muchísimo y por eso ahora Reddit comenzará a implementar una nueva herramienta de búsqueda impulsada por IA llamada Reddit Answers.

Esta herramienta, al igual que otros productos de búsqueda de IA, responde a las consultas generando respuestas bien formateadas y mostrando enlaces a sus fuentes.

Leer más
Un cohete Falcon 9 de SpaceX entró en los libros de récords
cohete falcon 9 spacex libros records

Un cohete Falcon 9 de SpaceX realizó su vuelo número 24 el miércoles, un récord para el propulsor de primera etapa.

Despegando del Centro Espacial Kennedy en Florida a las 5:13 a.m. ET, el cohete Falcon 9 de SpaceX lanzó 24 satélites Starlink a la órbita terrestre baja. Unos ocho minutos después del lanzamiento, la primera etapa del cohete realizó un aterrizaje impecable en un barco no tripulado que esperaba frente a la costa de Florida, allanando el camino para un vuelo número 25 una vez que haya sido revisado y acondicionado.

Leer más
Meta admite errores groseros en la moderación de contenido
Facebook celular

El máximo ejecutivo de Meta, Nick Clegg, reconoció que hay un problema mayúsculo con Meta, y es que la moderación de contenido está fallando.
El presidente de asuntos globales de Meta, dijo a los periodistas el lunes que las "tasas de error de moderación de la compañía siguen siendo demasiado altas" y se comprometió a "mejorar la precisión y exactitud con la que actuamos según nuestras reglas".
"Sabemos que al hacer cumplir nuestras políticas, nuestras tasas de error siguen siendo demasiado altas, lo que se interpone en el camino de la libertad de expresión que nos propusimos permitir", dijo Clegg durante una llamada de prensa a la que asistí. "Con demasiada frecuencia, el contenido inofensivo se elimina o se restringe, y demasiadas personas son penalizadas injustamente".
Clegg además reconoció que uno de los periodos más difíciles de moderación de contenido, fue para la pandemia de COVID-19.

"Teníamos reglas muy estrictas para eliminar grandes volúmenes de contenido durante la pandemia", dijo Clegg. "Nadie durante la pandemia sabía cómo se iba a desarrollar la pandemia, así que esto es realmente sabiduría en retrospectiva. Pero en retrospectiva, sentimos que nos excedimos un poco. Somos muy conscientes porque los usuarios alzaron la voz, con razón, y se quejaron de que a veces aplicamos demasiado y cometemos errores y eliminamos o restringimos contenido inocuo o inocente".

Leer más