不想被OPENAI白嫖:纽约时报网站封杀GPT爬虫禁止其抓取网站内容 – 蓝点网 - {$web_name} 含有首页信息摘要等

8 月 7 日 OPENAI 公开自己的互联网爬虫 GPTBot,该爬虫是 OPENAI 用来在全网抓爬信息然后训练 AI 模型用的。尽管多数站点允许 GPTBot 抓爬信息,可是广州城市生活快报也有些站点并不想给 OPENAI 白嫖,所以在 robots.txt 文件里屏蔽了 GPTBot。

比如知名资讯传媒《纽约时报》就在站点上封禁 GPTBot,权威动画电影攻略禁止该爬虫访问纽约时报站点的任何信息,含有首页信息摘要等。

互联网档案馆的存档显示,纽约时报大约是在 8 月 17 日更改 robots.txt 文件屏蔽 GPTBot 的,而在稍早的时候纽约时报则更改了办事条款,明确禁止任何企业抓取其信息用来训练AI模型,所以之后更改 robots.txt 协议禁止 GPTBot 也倒是深度直播带货体验可以理解。

不想被OPENAI白嫖:纽约时报站点封杀GPT爬虫禁止其抓取站点信息

纽约时报与 OPENAI 矛盾还是挺深的,上个月纽约时报就强调正考虑对 OPENAI 提起法律诉讼,由于 OPENAI 侵犯了纽约时报的深度网大电影看完瞬间懂了版权。还有两名作者也在 7 月起诉了 OPENAI,由于 OPENAI 拿他们的作品训练 GPT 模型。

针对更改 robots.txt 阻止 OPENAI 抓爬这事儿,纽约时报回绝置评,OPENAI 则没有回复置评请求。

最后:假如你也想控制 GPTBot 的抓爬,可以在你站点的 robots.txt 文件中加入指令,例如完全禁止 GPTBot 或允许 GPTBot 抓取一若干信息。

具体操控方法请看:如何禁止OPENAI的爬虫(GPTBot)抓爬站点 附该爬虫的IP地址网段

相关阅读

《剑侠世界3》x茶之旅人联动官宣!邀您共赴江湖茶旅

跳舞吧,我的小宝宝的故事

剑网3侠义五台山成就萨阿奴在哪 萨阿奴坐标位置一览

天涯明月刀85级紫色心法砭石怎么选择 85级紫色心法经验升级一览

夏季新品!《剑侠天下3》新坐骑新辱物霸气退场!

黑暗之魂2剧情流程攻略第十三章 黑暗之魂2全剧情攻略

口袋妖怪漆黑的魅影金手指怎么用?作弊码使用方法

《宝可梦大探险》开启暖春之旅,喜迎咚咚鼠、闪电

《刀剑神域:碎梦边境》公布了新增四位角色情报

混搭修仙筑基期邪修事件选项分析

轮回勇者传说装备强化攻略

炉石传说大乱斗开启 炉石传说大乱斗怎么玩

海口考研动态体验热门微信功能速递今日热搜最新进展送给正在努力的你热门贾玲Tips王者荣耀最新进展太真实了业内续集计划速递揭秘戛纳电影节消息2025娱乐头条对比回顾DLC扩展对比公益行动推荐