标签：抓取

脸书承认抓取澳洲用户数据来训练人工智能

脸书承认抓取澳洲用户数据来训练人工智能

在澳大利亚政府对人工智能采用情况的调查中，Meta 的全球隐私总监梅琳达·克莱博被问及她的公司是否一直在收集澳大利亚人的数据来训练其生成式人工智能技术。克莱博最初否认了这一说法，但在被逼问之下，她最终承认 Meta 会抓取自 2007 年以来所有脸书和 IG 帖子中的所有照片和文字，除非用户将帖子设置为私密。此外，她承认该公司并没有像欧盟用户那样为澳大利亚用户提供退出选项。克莱博说，欧盟存在退出选项，“是为了回应一个非常具体的法律框架”。

—— 澳大利亚广播公司

2024年12月5日
英伟达未经许可抓取了 YouTube 等平台视频

英伟达未经许可抓取了 YouTube 等平台视频

英伟达公司似乎已经收集了大量受版权保护的内容用于人工智能训练。英伟达要求员工从 YouTube、Netflix 和其他数据集下载视频，以开发商业人工智能项目。这些训练是为了为开发其 Omniverse 3D 世界生成器、自动驾驶汽车系统和“数字人”等产品的模型。对这一做法提出道德和法律担忧的英伟达员工被他们的经理告知，该做法已经得到了公司最高层的批准。为了规避 YouTube 的检测，英伟达使用具有轮换 IP 地址的虚拟机下载内容以避免被封禁。英伟达员工写到：“我们在使用 AWS ，重新启动实例会分配一个新的公共 IP，所以到目前为止这不是问题。”

—— 404 Media

2024年12月5日
马斯克：Twitter数据被数百个组织抓取

马斯克对 Twitter 要求登录才能查看网站上的内容事件回复

在回复 Epic Games CEO 蒂姆·斯威尼 (Tim Sweeney) 抱怨付费和账户墙如何破坏互联网时。

马斯克声称：数百个组织（也许更多）正在极其积极地抓取 Twitter 数据，以至于影响了真实的用户体验¹。为了缓解这种情况，我们还收紧了每个帐户（尤其是新帐户）可以下载的数据量的限制²。

我们应该怎么做才能阻止这种情况发生？我对想法持开放态度。

Several hundred organizations (maybe more) were scraping Twitter data extremely aggressively, to the point where it was affecting the real user experience.

What should we do to stop that? I’m open to ideas.

— Elon Musk (@elonmusk) June 30, 2023

Of course.

To mitigate this, we are also tightening limits on how much data can be downloaded per account, especially new accounts.

— Elon Musk (@elonmusk) June 30, 2023

2024年12月5日

标签： 抓取

脸书承认抓取澳洲用户数据来训练人工智能

英伟达未经许可抓取了 YouTube 等平台视频

马斯克：Twitter数据被数百个组织抓取

标签：抓取