自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

"影子档案"声称几乎复制了Spotify全部音乐库

2025-12-23 01:15:48
收藏

安娜档案馆备份了Spotify:史上最大规模音乐盗版行动?

以提供盗版电子书和学术论文检索服务闻名的影子图书馆「安娜档案馆」,本周末宣布了可能是音乐盗版史上规模最大的行动:「我们备份了Spotify。」

该组织声称从Spotify抓取了8600万个音频文件,覆盖了平台上实际被收听内容的99.6%。总数据量接近300TB,通过批量种子文件分发。

Spotify对此表示不满。发言人向公告牌杂志表示:「第三方通过抓取公开元数据,并利用非法手段规避DRM技术获取了平台部分音频文件。」请注意其谨慎措辞:「部分」音频文件。而安娜档案馆声称有8600万。Spotify未确认具体规模。该公司还指责该组织是「反版权极端分子」,此前曾盗取YouTube内容。

那么,除了侵害Spotify和主要依靠版税收入的音乐人权益之外,他们究竟获得了什么?

安娜档案馆声称获取了Spotify曲库2.56亿首曲目中99%的元数据,其中包括实际有人播放的8600万首核心曲目的音频文件。仅元数据库就包含1.86亿个独立ISRC编码。作为对比,最大的合法开放音乐数据库MusicBrainz仅收录约500万条——安娜档案馆构建的数据库规模是其37倍。

热门曲目以原始OGG Vorbis格式保存,码率160kbps,未经转码,音质无损。冷门内容则压缩为75kbps的OGG Opus格式以节省空间。该组织利用Spotify自身的流行度指标确定抓取优先级,重点收录流行度评分大于零的曲目。

Spotify曲库中超过70%的曲目流行度恰为零值,无人问津。排名前1万的歌曲流行度在70-100之间。仅约21万首曲目(约占曲库0.1%)流行度达到50以上——这0.1%的曲目构成了绝大多数收听行为。

当前Spotify排名前三的曲目?Lady Gaga与Bruno Mars合作的《Die With A Smile》(30.7亿次播放)、Billie Eilish的《BIRDS OF A FEATHER》(31.3亿次)以及Bad Bunny的《DtMF》(11.2亿次)。仅这三首曲目的总播放量就超过了排名末位的2000万至1亿首曲目之和。

换言之,Spotify本质上是一座无人聆听的歌曲坟墓。该组织决定不归档这座坟墓(完整曲库)——若全部备份需额外700TB存储空间,而这些内容仅占平台总播放量的0.04%。其中大量内容实为AI生成的劣质作品。

安娜档案馆发布了详尽的数据分析报告。部分发现符合预期,部分则出人意料。

曲目时长明显集中在2分钟、3分钟和4分钟整点。团队表示尚未查明原因。自2015年起专辑发行量呈指数级增长,仅2023年就有超过1000万张专辑问世——这很可能由AI生成和自动上传驱动。

按艺人数量计算,电子/舞曲是最大流派(520,075组),其次是摇滚(370,179组)和世界/传统音乐(202,529组)。此外,无论信与否,歌剧、合唱和室内乐在每个具体子流派中拥有最多的艺术家。

音频特征数据显示:响度与能量值显著相关(意料之中),BPM呈正态分布且集中在120附近,多数曲目「语音度」与「器乐度」评分较低——意味着人声占主导。C大调和G大调是最常见调性。约13.5%的Spotify曲目被标记为露骨内容。

安娜档案馆将其定义为保存而非盗版。博客文章写道:「我们认为自身肩负着建立音乐档案馆的使命,主要致力于文化保存。」该组织主张现有音乐存档过度聚焦流行艺人和无损音质格式(FLAC),导致冷门音乐在平台政策变更或关闭时面临永久消失风险。

此说确有依据。Spotify掌控着2.56亿首曲目,可随时下架内容、变更授权条款甚至停止运营。去中心化的种子分发创造了无法被单一实体摧毁的冗余备份。这些数据已遍布全球数千个种子节点。

但客观而言,这同样是盗版行为。Spotify向艺人支付的单次播放收益介于0.003-0.005美元。根据Dittomusic的收益计算器,100万次播放可为艺人产生4370美元版税。而通过种子免费分发则彻底剥夺了这项微薄收入。

两种观点同时成立。

安娜档案馆正面临日益严峻的法律压力。比利时于2025年7月发布封禁令,最高罚款50万欧元;英国高等法院于2024年12月实施封锁;德国主要ISP在2025年10月屏蔽了该网站主域名。据其透明度报告显示,谷歌已从搜索结果中移除7.49亿个安娜档案馆链接——这相当于该搜索引擎自2012年以来收到的全部DMCA移除请求的5%。

合法非营利组织「互联网档案馆」因其数字化78转唱片的大78项目被出版商索赔6.21亿美元后达成和解。而安娜档案馆存档的曲目数量是其3.1万倍,且均为当下流行内容。音乐产业的法律反击将使互联网档案馆的案例相形见绌。

在Hacker News论坛上,评论者就档案馆的实际效用展开激辩。有人指出安娜档案馆已为其图书档案提供数万美元的「企业级」访问权限——实质是向AI公司批量出售训练数据。

目前仅元数据完全公开。音频文件正通过批量种子逐步释出,从最热门曲目开始。安娜档案馆呼吁用户协助做种,并表示若需求充足可能开放单文件下载。

法律诉讼或将接踵而至。唯一悬念是档案馆能否存活——但时至此刻,答案或许已不重要。数据已然存在,分散于无数无法被集中摧毁的节点。这正是种子技术的核心意义。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻