GA4引入DDA作为默认归因?且慢!
当地时间10月5日,谷歌GA团队发布声明,将对GA4作进一步的更新。对于本次更新各媒体的看法是谷歌暗示UA退出历史舞台的速度将加快。因为字面的意思是“我们鼓励您使用新的Google Analytics 作为您未来的主要网络和应用程序分析解决方案。”那么这次更新究竟包含了啥?
GA4即将新增与GSC的数据对接
在现有的GA4中,我们并不能看到与Google Search Console的对接。在ADMIN-PRODUCT LINKING之下,我们仅能看到Google Ads Linking,Ad Manager Linking,BigQuery Linking三个选项。不久以后,我们便可以像原来在GA3(使用analytics.js/gtag.js的Universal Analytics)中那样与GSC数据对接了。
“Search Console提供有关您网站的自然搜索性能的详细信息,包括网站在搜索结果中的排名、带来点击的查询以及点击后数据(如参与会话和转化)。通过新的 Search Console 集成,您将能够了解自然搜索相对于其他营销渠道(例如搜索广告、电子邮件或社交)在增加网站流量和参与度方面所起的作用。”
罗素凯彻姆 Google Analytics 产品管理总监
如果真的能像上面描述的那样,这实在是一种进步。因为在GA4以前,虽然我们可以看到GA中导入的GSC数据,但是对于某些检索词的表现、它们最终转化如何,我们并不清楚。
GA4将启用DDA作为默认归因模型
谷歌引入Data-Driven-Attribution已经有6个年头,从Google Ads到GA360,DDA已经成为搜索营销人员熟知的归因模型。极诣在2017年曾经介绍过这种以沙普利值作为算法的归因模型。虽然其合理性不如马尔科夫链模型,但是由于方便计算且比传统模型更科学的优点还是值得使用。
接下来的更新中GA4就将继Google Ads之后采用DDA进行默认的归因和汇报。并且,与Google Ads中一样,谷歌不再需要最少学习数据就可以为你用DDA计算新的转化分配。
这种“先上车后买票”的做法让人匪夷所思。可以预料到的是谷歌会先用一种粗放的模型来套用,在数据不断积累之后再慢慢修正初始的误差。
DDA还可以被应用到之前极诣介绍过的两个新报表Model comparison和Conversion paths中。看似高级,可是问题出在Default channel grouping上。我们知道在以往的版本中用户是可以自定义Channel Grouping的,我们如果发现某个谷歌没有正确归类的访问来源,我们是可以自定义将它们归为某种来源的。为了解决这个问题,极诣曾经专门写过用Data Studio来克服的教程。毕竟我们如果连渠道归类都搞不清楚那么再高级的归因还有什么意义呢?
在此,假设我们依旧可以通过Data Studio或者BigQuery来重新归类访问来源,但是之后又有谁来为我们用DDA重算各渠道类别的转化数呢?这点,我们不得而知。我们只知道,GA4的默认渠道分类相当简单粗暴:
Channel | Definition |
---|---|
Direct | Source exactly matches direct AND Medium exactly matches (not set) OR Medium exactly matches (none) |
Organic Search | Medium exactly matches organic |
Paid Social | Source matches matches regex ^(internal list of social sites)$ AND Medium matches regex ^(cpc|ppc|paid)$ |
Organic Social | Source matches matches regex ^(internal list of social sites)$ OR Medium matches regex ^(social|social-network|social-media|sm|social network|social media) |
Medium = email|e-mail|e_mail|e mail OR Source = email|e-mail|e_mail|e mail | |
Affiliates | Medium = affiliate|affiliates |
Referral | Medium = referral |
Paid Search | (GA Medium matches regex ^(cpc|ppc|paidsearch)$ AND GA Ad Network does not exactly match DISPLAY) OR GA Ad Network exactly matches PAID_SEARCH |
Video | GA Ad Network exactly matches VIDEO |
Display | GA Ad Network exactly matches DISPLAY |
极诣只能建议读者依旧从Last (Paid) Interaction出发来看数据了。先不要急着用GA4告诉你的数据来做决策。
“模糊”化的分析数据
“建模”的“模”和“模糊”的“模”是一个汉字真是体现了中华智慧。如果要问谷歌是如何应对“第一次互联网隐私危机”的,那或许答案便是“建模”。谷歌的“建模”如同FLoC,很大程度上是和“模糊”化分不开的。
The future is based on first-party data.
Vidhya Srinivasan,谷歌广告购买、分析和衡量副总裁
The future is consented.
And the future is modeled.
既然未来是基于建模数据的,那真实数据就只能掌握在少数人手中。只是但凡你记得去年年底极诣的那篇《再谈GA数据的不一致,罪魁祸首竟是它!》你就能懂得“差之毫厘,谬以千里”的道理。
谷歌对数据进行建模处理的“官方说法”是将那些“无人认领”的转化按照模型分配到各个渠道中,这些转化可能是因为隐私保护或者用户不接受Cookie无法跟踪到。但是这里将会产生一个极端严重的反信任危机。因为你怎么证明你没有把更多的转化算在Google Ads(或者其他G系广告)头上?你的机器学习和其成果始终会是一个黑盒子,GA4的用户如何才能知道并相信被套用的结果是公平公正有据可依的呢?
对于建模和转化归因,如果你想了解更多,可以参考Ken Williams的文章《How conversions are modeled in Google Analytics 4》
以上我们介绍了GA4正在发生的变化和笔者的个人看法。我们正在经历一个超强数据能力与超严格数据保护的两股力量碰撞的时代,如何能比竞争对手多看到一些真实的数据并产生更正确的洞察会是未来五年乃至十年胜负的关键。