反盗版组织将知名AI训练数据集“Books3”下线。
丹麦反盗版组织Rights Alliance已经下线了知名的“Books3”数据集,该数据集被用来训练包括Meta在内的高知名度AI模型。
出版商代表发送了删除通知,促使“The Eye”移除了这个包含了近20万本书籍的37GB数据集,该数据集已经在其上托管了数年。然而,复制品仍在其他地方出现。
这个数据集包含了来自盗版网站Bibliotik的所有书籍,于2020年末首次在The Eye上发布,自那以后已被用来训练多个AI模型,包括Meta的模型。
虽然最初且流传最广的 Books3 下载链接现已离线,但该数据集并未完全从网络上消失。Shawn Presser 还提供了新的下载链接:链接
—— Torrentfreak
发表回复