Un popular centro de archivo afirma haber publicado una copia de seguridad de Spotify en torrents masivos que suman 300TB o aproximadamente 86 millones de archivos de música, agrupados por popularidad. Si esperas un reflejo limpio y completo del catálogo de Spotify que puedas descargar de una sola vez, eso no es lo que está disponible hoy en día.
Lo que está activo son los datos del catálogo: bases de datos SQLite que, según el grupo, contienen la mayor base de datos pública de metadatos musicales, que cubre 256 millones de pistas y 186 millones de ISRCs únicos.
Anna’s Archive dice que normalmente se centra en el texto porque es denso, pero su misión es preservar el conocimiento y la cultura a través de los medios. También afirma haber encontrado la manera de extraer Spotify a gran escala y ve esto como un comienzo para construir un archivo musical centrado en la preservación. Si este archivo es demasiado, quizá la función offline de Spotify sea para ti.
ACTUALIZACIÓN: REACCIÓN DE SPOTIFY:
Una investigación sobre accesos no autorizados identificó que un tercero extrajo metadatos públicos y utilizó tácticas ilícitas para eludir el DRM y acceder a algunos archivos de audio de la plataforma. Estamos investigando activamente el incidente.
La declaración de Spotify no llega a confirmar la escala descrita por Anna’s Archive. Aunque la plataforma afirma que solo se accedió a «algunos» de sus archivos de audio, Anna’s Archive afirma que pudo archivar música que representa el 99,6% de todas las escuchas en Spotify.
Lo que incluye la versión de la base de datos
En su artículo, el grupo sostiene que la música ya está bastante bien conservada, pero señala tres lagunas: una larga cola que solo se guarda cuando a alguien le importa lo suficiente (y los torrents pueden estar mal sembrados), una inclinación audiófila hacia archivos enormes sin pérdida que dificulta que «todo» sea difícil de conservar, y la falta de una lista autorizada de torrents que represente toda la música grabada.
Su volcado de metadatos en Spotify está posicionado como la solución. Afirma cubrir metadatos para aproximadamente el 99,9% de los artistas, álbumes y temas, con el conjunto de datos principal de artistas, álbumes y pistas comprimidos por debajo de 200GB, además de un conjunto de datos de análisis de audio separado listado con 4TB comprimido.
El audio viene en lotes
El audio es la parte que más interesará a muchos lectores, y es la que aún se está desplegando. Anna’s Archive dice que ha archivado alrededor de 86 millones de archivos musicales, que representan alrededor del 99,6% de las escuchas, pero esos archivos musicales están previstos para lanzarse en orden de popularidad, no como una sola entrega.
También señala las elecciones de calidad. Para una popularidad superior a 0, dice que sacó el OGG Vorbis original a 160 kbit/s sin recodificación. Para una popularidad igual a 0, dice que se reencodificó a OGG Opus a 75 kbit/s, y señala un error de la etiqueta ReplayGain que afecta a muchos archivos.
Qué ver a continuación
El grupo establece un corte para 2025-07, lo que significa que las liberaciones posteriores a julio de 2025 pueden no estar presentes. También detalla los siguientes pasos: archivos de música, luego metadatos adicionales (rutas y sumas de comprobación), después carátulas de álbum y archivos de parche destinados a reconstruir los originales. La conclusión práctica es que esta copia de seguridad es solo metadatos por ahora, con audio que llegará más tarde.