百度,忙着改版
|

百度推广不再提供用户Query数据?你应该知道什么?

百度,忙着改版
百度,忙着改版

7月初,百度推广停止在点击的HTTP请求的Referer字段中提供word/wd值。这就意味着你的第三方网站分析工具,如Google Analytics已无法获取用户的检索词信息。这本不是新闻,因为5月底百度就已经通知到各广告主。但是最近有极诣的读者小伙伴问起,因此本篇就用来说明一下影响和对策。

为什么不再提供检索词信息,到底发生了什么?

极诣在2015年就率先发现了百度取消提供自然搜索中的检索词信息(有兴趣的可以去考古)。当时在墙内的SEO界引起了巨震,这一变化意味着你通过第三方的网站统计工具无法获得用户检索词信息,也无法分析哪些检索词给你带来了最终转化。

这一变化后要想获得自然搜索的检索词信息只有两个方法:

  1. 使用百度统计,第二方的工具自然会整合。
  2. 使用百度搜索Referer API解析eqid,必须使用百度云服务器而且调用也是氪金的。

而今年的更改是把这一变化蔓延到了百度推广。7月7日开始你将无法从百度付费搜索点击中直接获得用户检索词信息。

如何从技术上看这个更改

HTTP头中的referer字段中的word信息代表了检索词
HTTP头中的referer字段中的word信息代表了检索词

上图来自百度的官方文档。图中的“%e9%b2%9c%e8%8a%b1”即是汉字“鲜花”。当点击了百度广告后一连串HTTP请求中,不管是302还是200都会带上这个字段(除非主动选择不传递)。于是当用户到达我们的落地页时我们便能够看到用户最终是检索那个词进行的搜索。

更新之后word=或wd=的值将为空,这样我们就无法从Google Analytics这样的网站分析工具得知用户检索的是什么词了。

为此,百度给了一个“安慰性”的弥补方式。那就是在点击发生后15-30分钟百度会通过其服务器给广告主指定的地址发送一些信息。之所以说“安慰性”是因为你无法将检索词和转化连接起来。

目前百度仅仅开放了四个字段,分别是

  • uid={userid},推广账户ID
  • query={query},检索词
  • ip={ip},IP地址
  • time={time},时间戳
百度推广并行跟踪示意图
百度推广并行跟踪示意图

由于落地页网站和客户监测服务器是无法完全将这两个数据碎片整合起来的所谓“数据加工&统计”也就是空谈了。

这是百度的Parallel Tracking(并行跟踪)吗?

Google Parallel Tracking演示
Google Parallel Tracking演示

如果你是极诣的忠实读者,你应该记得极诣在2018年9月介绍了谷歌的Parallel Tracking功能。当时谷歌是为了应对Safari的ITP而推出退让方案。本次百度推广的更改与谷歌的并行跟踪异曲同工,百度的解释是“为保护客户推广权益和流量隐私”。

因此我们要知道这个和用户的隐私没有关系,保护的不是用户的隐私。首先作为广告主你当然有权知道检索词,其次你的技术服务商会被你“授权”知道。当HTTP请求头的referer中包含word/wd值时该请求路径中的各个跳转服务器会知道,落地页上的第三方脚本会知道。这些都基于你选择了这些第三方跟踪服务器和脚本。除此之外,如果该请求为安全请求,中间路由并不能嗅探到这些信息。

隐藏wd但保留oq意味着什么?
隐藏wd但保留oq意味着什么?

我们可以断定这个和用户隐私没有任何关系的另一个证据是HTTP请求头的referer字段中依然会保留oq这个参数的值。什么是oq?这个参数代表用户上一次检索的检索词。既然referer中依然保留了oq,那就说明这和用户隐私无关,要隐藏也该隐藏所有检索历史不是吗?

另外,新采用的通过URL加参数的方法还不如用HTTP请求头来得安全,因此坦率来讲极诣不是很明白百度推广这一更新到底是什么操作。

关于应对方法

首先我们要问自己我们是否需要去应对这一变化。对PPC来说,分析检索词到转化的路径虽然可以给我们更多细节但是并不能给我们更多洞察。大部分时候在关键字的层面我们就已经可以非常有效地且有效率地对推广进行优化了。

因此极诣认为,大部分推广广告主并不需要应对这一改版开发一套工具整合检索词到网站分析平台中去。

那么,如果你认为你不是大部分广告主且满足下面两个条件呢?

  1. 对数据采集有极大兴趣,
  2. 能够忍受数据不完整。

那么你可以考虑整合检索词的数据,假定你要整合到GA,极诣也在这里提供一个思路。你甚至不需要有足够资源开发数据接收处理的程序。分下面几个步骤:

  1. 在GA中新建自定义维度,将访客IP地址和精确到小时的访问时间字符串连接后Hash并存放到该自定义维度中。你可以通过GTM方便地完成这一操作
  2. 再新建一个自定义维度放检索词
  3. 获取百度服务器回传的数据并整理
    1. 提供一个空网页给百度
    2. 通过服务器的access.log获得回传数据
    3. 用一个Excel整理回传的数据获得IP和时间戳
    4. 将IP和精确到小时的时间字符串连接后Hash并作为Key
    5. 得到包含Key和检索词两栏的csv文件
  4. 在GA中上传csv数据
GA中如何导入外部数据?
GA中如何导入外部数据?

为什么我们要精确到小时呢?因为访问时间和点击时间并不对应。为什么不能光使用IP呢?因为IP不唯一。为什么不用GA的Management API而要去界面上传呢?因为免费版本的GA每天都有限额,而且一定不够用。

当然,百度依然有可能还在改进这个新特性。您可以等等看看短期是否会有新的解决方案。

类似文章