Después de que Meta anunciara el fin de la moderación en sus plataformas, ahora se le sobrevino un nuevo problema, ya que una investigación de Wired y también del medio británico The Guardian, dan cuenta de que la compañía de Mark Zuckerberg estaba usando libros descargados de manera pirata de servidores torrent.
Documentos judiciales recientemente no editados alegan que Meta, el archivo en línea Library Genesis para entrenar sus modelos de IA, informa Wired.
En una demanda en curso presentada contra la plataforma por un grupo de autores, incluidos Ta-Nehisi Coates y la comediante Sarah Silverman, los documentos finalmente se publicaron en su totalidad después de que un juez rechazara los intentos de Meta de mantener partes de ellos selladas.
El juez argumentó, según Wired, que Meta luchó por las redacciones simplemente para «evitar publicidad negativa», citando una cita interna condenatoria de uno de sus empleados.
«Si hay cobertura mediática que sugiere que hemos utilizado un conjunto de datos que sabemos que es pirateado, como LibGen, esto puede socavar nuestra posición negociadora con los reguladores sobre estos temas», escribió el empleado de Meta no identificado.
¿Cuál es el argumento que quiere usar Meta?
Library Genesis, o LibGen, es una «biblioteca en la sombra» que proporciona acceso gratuito a millones de libros, artículos académicos y revistas.
Meta y otros líderes de IA argumentan que el uso de libros y otros datos extraídos de la web constituye un «uso justo», pero en última instancia dependerá de batallas legales como esta determinar si ese es el caso.
Con un emoji sonriente, un ingeniero escribió: «Descargar torrents desde una computadora portátil corporativa [propiedad de Meta] no se siente bien», según lo citado por Wired.
Y llega hasta la cima. Un memorándum citado supuestamente muestra que después de que las discusiones de los empleados sobre el uso de LibGen se intensificaran a «MZ» (el CEO de Meta, Mark Zuckerberg), el equipo de IA fue «aprobado para usar» material de la base de datos.
«Meta ha tratado la llamada ‘disponibilidad pública’ de los conjuntos de datos en la sombra como una carta para salir de la cárcel, a pesar de que los registros internos de Meta muestran que todos los responsables de la toma de decisiones relevantes en Meta, incluido su CEO, Mark Zuckerberg, sabían que LibGen era ‘un conjunto de datos que sabemos que es pirateado'», escribieron en la moción más reciente los demandantes.