OpenAI发布GPTBot，GPT优化终于有据可依

ChatGPT的制作公司OpenAI最近发布了一个被叫做GPTBot的爬虫。该爬虫将会被用于数据收集并提供给AI训练。这些成果将影响GPT-4和GPT-5的准确性。

说到与ChatGPT相关的爬虫，马老师在今年曾先后介绍过CCBot和ChatGPT-User。前者被用于早期ChatGPT的数据收集，这部分数据到21年底为止。后者被用于Browsing插件检视目标网页内容。

可以这么说，一个是已经或即将被弃用的爬虫，另一个是仅仅处理单一请求的爬虫。GPTBot的推出意味着ChatGPT-User并不能使得GPT-4的知识库增长。

GPTBot才是GPT派来刷经验真正用来收集信息并升级知识库的爬虫

那么现在我们就可以推断，你的网站的内容想要被GPT引用的前提是GPTBot来爬过你的网页。如何找到GPTBot的爬行记录呢？你可以在你的网站的access log中寻找类似这样的User Agent：

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

当然，你也可以通过robots.txt文件来控制哪些内容可以被ChatGPT获取，哪些不可以。

比如，你不想让GPT爬虫获取任何你的网站的内容。你可以在robots.txt中这样写：

User-agent: GPTBot
Disallow: /

如果想让除了某个目录的其他内容不被爬取，可以这样写：

User-agent: GPTBot
Allow: /dir-1/
Disallow: /

与robots.txt相关的知识点可以参考马老师以前分享的内容。

如果你有对版权的顾虑可以对某些内容进行GPT的屏蔽，但是如果你特别在robots.txt中allow了内容，可能就意味着对GPTBot开放版权。这点请注意。

从现阶段的ChatGPT的特性来看，即便提供了内容，ChatGPT也不会给出引用出处。因此开放你的内容仅仅是为爱发电。理论上只要你没有屏蔽BingBot，搜索引擎依旧可以发现你的内容，依旧能够通过New Bing为你带来一些流量。

GPTBot的推出意味着什么？

GPTBot的推出意味着OpenAI通过这大半年的时间已经沉淀了许多用户的使用数据，同时截止到21年的知识库不再能满足现有用户的需求。即便考虑到插件的补充，这部分知识的缺失会使得体验下降。

GPTBot的推出也意味着OpenAI有足够能力来辨识信息的可靠性。我们知道ChatGPT推出前后都有大量机器人产出的内容，许多都是胡说八道的假新闻。OpenAI现在有一定信心对此进行干预。

对于致力于品牌传播和搜索引擎营销的我们来说，GPTBot的出现给我们重要的参考。我们可以更好地研究GPTBot获取了我们哪些信息，我们的内容是否受到AI的关注，我们如何提高AI对我们内容的爬行频率和覆盖率。这些指标都是极为有用的。

类似文章

搜索引擎营销|数字营销

推广效果报表，你做得对吗？
作者Hermes Ma 2015年12月16日2017年5月13日

数字营销的推广效果报表和网站分析报表有很多相似的地方也有一些很明显的不同会造成一些新手容易犯的错误。本周极诣将会通过常见错误来介绍推广效果报表制作中的“玄机”。

阅读更多推广效果报表，你做得对吗？
数字营销|社会化媒体营销

Facebook调整News Feed算法是在自寻死路？
作者Hermes Ma 2014年1月3日2017年5月13日

Facebook在2013年下半年更新了他的NewsFeed（动态消息）排序算法，其中Top Stories（动态头条）使用了一种新的算法。实质上造成了一个恶性循环。

阅读更多 Facebook调整News Feed算法是在自寻死路？
数字营销|营销策略

被营销的营销者
作者Hermes Ma 2024年7月3日2024年7月3日

作为营销者的马老师每次被相关广告击中，总会暗中小小称赞一下广告主的努力。接着点进落地页，又自然会对其心中暗自点评。然后感叹一下，营销毕竟还有科学，且不停地在进步。营销者毕竟同时也是消费者，转换视角听听别人讲得故事也不错。

阅读更多被营销的营销者
搜索引擎营销|数字营销

SEM，为什么我的转化率那么低？
作者Hermes Ma 2016年6月1日2017年5月13日

数字营销的全部奥义精髓都围绕着“转化”二字来进行。为什么我的转化率那么低？有哪些致命的错误会导致你的Campaign转化率降低？极诣为你一一细数那些我们常犯的错误。

阅读更多 SEM，为什么我的转化率那么低？
数字分析|数字营销

“爹味”十足的“数据驱动”到底有什么毛病？
作者Hermes Ma 2022年6月15日2022年6月15日

极诣在过去近10年的时间中一直倡导着以数据为驱动，规划并实施营销活动的方法。但是，最近服务客户的过程中遇到了一些人和事，慢慢地让马老师反思数据驱动膜拜对营销人产生的反噬作用。如果我们无法认清这点，我们将会深陷数据驱动的泥潭，丧失视野和行动能力。

阅读更多 “爹味”十足的“数据驱动”到底有什么毛病？
数字分析|数字营销

教程：用GA和GTM跟踪网站上的视频播放事件
作者Hermes Ma 2014年11月5日2017年5月13日

视频作为重要的多媒体元素对提升转化率有着非常积极的作用。本篇通过Wistia和优酷视频的跟踪讲述了运用Google Analytics和Google Tag Manager跟踪第三方视频播放的简单方法

阅读更多教程：用GA和GTM跟踪网站上的视频播放事件