微闻

丹麦反盗版组织 Rights Alliance 下线了盗版书籍 AI 训练数据集 Books3

反盗版组织将知名AI训练数据集“Books3”下线。

丹麦反盗版组织Rights Alliance已经下线了知名的“Books3”数据集,该数据集被用来训练包括Meta在内的高知名度AI模型。

出版商代表发送了删除通知,促使“The Eye”移除了这个包含了近20万本书籍的37GB数据集,该数据集已经在其上托管了数年。然而,复制品仍在其他地方出现。

这个数据集包含了来自盗版网站Bibliotik的所有书籍,于2020年末首次在The Eye上发布,自那以后已被用来训练多个AI模型,包括Meta的模型。

虽然最初且流传最广的 Books3 下载链接现已离线,但该数据集并未完全从网络上消失。Shawn Presser 还提供了新的下载链接:链接

—— Torrentfreak

更多文章

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注