OpenAI允许阻止其网络爬虫

作者：

在

OpenAI 现允许网站阻止其网络爬虫抓取数据，避免数据被用于训练 AI 模型

OpenAI 在其博客文章中表示，网站运营者可以通过在其网站的 Robots.txt 文件中禁止 GPTBot 的访问，或者通过屏蔽其 IP 地址，来阻止 GPTBot 从其网站上抓取数据。

GPTBot是OpenAI的网络爬虫，可以通过以下用户代理和字符串来识别。
User agent token: GPTBot
Full user-agent string:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

禁止 GPTBot
User-agent: GPTBot
Disallow: /

自定义 GPTBot 访问
User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/

IP 出口范围
40.83.2.64/28

—— OpenAI

OpenAI

OpenAI允许阻止其网络爬虫

更多文章

Spotify推出新功能绕过苹果30%佣金

“欧盟与美国就减少关税达成协议”

TikTok在澳大利亚市场展现强劲增长

标题：Temu应对美国市场调整措施

Waymo自动驾驶展现卓越安全性能

英伟达担忧华为AI芯片竞争实力

美国白宫宣布国家安全顾问迈克·沃尔茨被提名为驻联合国大使

通用汽车及汽车行业面临高额关税成本冲击

评论

发表回复取消回复

OpenAI允许阻止其网络爬虫

更多文章

评论

发表回复 取消回复

发表回复取消回复