Anna’s Archive 安娜的档案 Spotify整个平台的音乐

Anna’s Archive 最近做了一件听起来就很“过分”的事——成功爬取并备份了 Spotify 的绝大部分内容,不只是元数据,还包括音乐文件本身,规模直接拉到 8600 万首音乐文件、2.56 亿条音轨记录、1.86 亿个 ISRC,做成可查询的 SQLite 数据库,再用自家的 AAC 容器格式打包,通过 大体量 Torrent 分发,总量接近 300TB,这已经不是收藏,而是基础设施级别的存档
更有意思的是它的爬取报告逻辑:37% 的歌曲量满足了 99.6% 的用户收听范围,热门曲目保留 OGG Vorbis 160kbps,而大量播放量为 0 的长尾音乐被转为 OGG Opus 75kbps 节省空间;数据分析也相当“冷静”,比如 70% 的歌曲播放量低于 1000、头部三首歌的播放量超过数千万首尾部曲目之和、整分钟时长存在异常峰值,以及近年大量疑似AI 生成音乐涌入平台——安娜报告里说得很直白,这不是为“最好听的音乐”建库,而是为人类音乐活动本身留底,不让它只剩算法和商业选择.
网址:https://annas-archive.li/



















Discussion
New Comments
暂无评论。 成为第一个!