Google Analytics上级应用教程
|

嘿,是时候对Google Analytics访问来源做个整理了

Google Analytics上级应用教程
Google Analytics上级应用教程

Google Analytics中查看访问来源是相当方便的。你在标准报表中就可以有多种方式对访问来源和媒介进行分类。最常用的是Acquisition > All Traffic > Source/Medium报表。这也是十多年来GA中最经典的报表之一。

但是,如果你足够细心的话就会发现,对一些来源GA的分类方法还是会有一些问题。比如我们看下图:

一些本该是自然搜索流量的媒介变成了引荐
一些本该是自然搜索流量的媒介变成了引荐

图中我们看到了baidu.com成为了referral,cn.bing.com也成为了referral。而这些是实实在在的自然搜索流量,本应该也是organic的。那么为什么会出现这种状况呢?这就要对GA的自然访问来源的来龙去脉进行梳理了。有条件科学上网的同学可以查看Google Analytics官方的文档

用一句话概括就是,GA会根据referrer的域名以及referrer后面所带的参数来识别该流量是否为自然搜索流量。比如,访问你的网站的前一条网址是http://www.bing.com/search?q=maxket.com。那么该访问就会被识别为organic媒介的访问。

在上述的官方文档中,谷歌整理了一系列默认被识别为自然搜索流量的域名和参数。但是不乏一些小的搜索引擎没有入谷歌的法眼,于是就不会被识别为自然访问流量。在这种情况下就会被识别为referral。

我们上面给的两个例子中baidu.com未能被识别为organic的原因是前一条网址并不带参数。极诣在多年前的文章中指出过百度已经不再对网站提供检索词信息,在http头信息中的referer字段中虽然还保留参数wd,但是wd=之后却是空值。由于wd参数还在,因此GA依然能够识别该访问为自然搜索访问并赋予organic。不过当wd参数丢失的时候就没有那么幸运了,此时就变成了referral。

cn.bing.com的情况更加复杂,首先是cn.bing.com可能并不在GA的默认搜索引擎域名列表中。这里说可能,是因为即使它在列表中,也会因为没有带能够被GA识别的参数而被排除organic。因为我们可以确认的是http头部信息中的referer字段中并不带任何参数。因此cn.bing.com也被误认为了referral访问。

这两个例子都有一个特点,如果你在你的网站中也发现它们的踪迹的话,你可以在Source/Medium下面的Referrals报表中点击进入查看Referral Path,不出意外的话是一个“/”。这就说明本身点击到你的网站的时候,http头部信息中的referer字段被“篡改”了。

事实上,这是一种场景的现象。属于Referrer Policy的规定。如:

origin:在任何情况下,仅发送文件的源作为引用地址。例如 https://example.com/page.html 会将 https://example.com/ 作为引用地址。

又如:

origin-when-cross-origin:对于同源的请求,会发送完整的URL作为引用地址,但是对于非同源请求仅发送文件的源。

(Referrer Policy还有其他很多中,其中也包含了丢失Referrer让organic或referral等变成direct的情况。在此就不展开了。)

在这些情况下,你的网站的GA跟踪代码(不止是GA,所有的跟踪工具)看到的只是https://www.baidu.com/或者https://cn.bing.com/。后面所有的path和参数都被舍弃了,这就是为什么GA无法识别它们为自然搜索流量。因为这个访问还真有可能是百度把你网站的链接放在它的首页呢?!

为了解决这些问题,我们需要从两方面入手。

其一是添加GA未能识别的域名。为了方便极诣的忠实读者,我们就只说操作。你必须拥有GA中Property的管理权限。

添加神马和搜狗
添加神马和搜狗

我们已知了神马和搜狗的域名和参数,只需要在Tracking Info > Organic Search Sources中添加图中的三行即可。

其二,对于连参数都被隐去的搜索引擎和一些特殊情况,我们无法在上面的设置更改,这就要应用GA中的Channel Grouping功能。同样为了方便说明,请按照下图进行操作:

把那些缺少参数的搜索引擎流量聚合起来
把那些缺少参数的搜索引擎流量聚合起来

图中都是一些常见的存在丢失参数问题的中文搜索引擎。别忘了保存。

上述两步操作以后,大概经过24小时,你就可以接受干净的访问来源了。值得注意的是,在未来,你要使用medium=organic这个条件时,千万要记得我们在Channel Grouping里修正的这些来源的medium依旧是referral。

为了彻底地解决这些问题,你就需要更骚的操作了对不对?此时你便可以把Filter功能祭出来了。见下图(未验证实际referer,请谨慎使用):

补上丢失的参数
补上丢失的参数

该方法使用了正则表达式,匹配了以baidu.com/结尾的Referral并在后面添加上了空的wd参数。这样访问源就被纠正回来了。对于神马和搜狗这些没有丢失参数的引擎,你不需要这样操作,依然是正常添加即可。

以上就是极诣本篇要介绍的对GA的访问来源进行整理的内容。如果您有一些体会或者文章有所疏漏,欢迎在极诣的公众号留言。

类似文章