归因(Attribution)真的能说明因果关系(Causation)吗?相关性(Correlation)有话要说
近年来,我们购买产品和服务的方式发生了巨大变化。我们现在面临着涉及许多不同购买途径的客户旅程——这对数字营销者来说一直是一个挑战。

极诣多年来多次撰文分享归因的思维和方法,感兴趣的话请回顾极诣以往的文章:
- 《去TMD的“有转化的关键字”》
- 《当下数字营销人才最缺什么技能?》
- 《Google Analytics自定义归因模型详解,个性化你的功劳簿》
- 《合格的数字营销者的十大素质》
- 《高阶媒体归因:沙普利值vs马尔科夫链》
谷歌在吸收了Adometry之后曾经踌躇满志地发布了Google Attribution。当时胃口吊的笔者连发两文。

两年后我们再去attribution.google.com还是老样子不同的是那个让人感觉不太妙的红色logo。

MarketingLand早在今年1月份就表达了对该产品的担忧。另一方面在三月份的时候Google Data Studio的更新中也提到“Google Attribution 360 connector is now called TV Attribution”。这估计是要实锤了。
事到如今我们是否能再从别的角度来反思归因呢?铺垫了那么久,本文我们要说的就是这个。统计学大佬请轻拍,其他人请系好安全带,我们要开车了。
归因到底怎么了?
我本不愿用“归因”这个翻译,因为attribution这个词只是讲一种“分配”,而并没有明示“因果关系”,因此翻译为“归功”更妥。就好像对于你把事办成了这个“果”来说你是“因”,但是功劳却永远是老板的,懂了吧?
真要用归因那就应该是“Causation”的中文翻译。

我们通常在营销上讲的Attribution,简而言之,是在营销活动或接触点之间分配销售价值的方法。在某人从您那里购买产品或服务之前,他们往往会接触到大量的营销接触点。它们涵盖了广泛的在线渠道,如PPC和affiliate,以及线下渠道,如直邮和电视广告。归功将最终销售的功劳分配给有助于它的营销接触点。
我们有各种模型来进行对功劳进行分配,但这就如我们前面的例子那样,归功并不能很好地匹配因果,它只能提供一些相关性。这是归功/Attribution最大的问题。
因果关系和相关性
前不久有个大新闻,说是美国权威医学期刊说“丹参或大幅提高心衰死亡率”(B站:av64922197)。细看之后我们才发现这只是国内“日常黑中医”媒体的误读,因为研究中只是说用丹参和出血为正相关,它并不能体现因果关系。说不定就是因为出血才要上药啊?
我们再来看另一个例子消防员和火灾。数据显示,参加火灾的消防员越多,火灾造成的伤害就越大。从统计上来说,这是准确的,但在逻辑上它是有缺陷的。因为火灾更大,需要更多的消防员来对抗它。

如果事件A与事件B正相关,那么A发生时B发生的机率会更高,B发生时A发生的机率也会更高。我们要理解因果关系和相关性之间的差异,对于数字营销人员来说是一个共同的挑战。如果我们将相关性误认为因果关系,这可能会导致我们在下次召唤时做出错误的决定。
归功模型的另一缺陷
那么有的杠精又要说了,客户旅程中都是有先后的。消费者并不是买了单后才看广告的。
没错,是有先后。我们必须看到的是归功模型的另一个缺陷,几乎所有的模型中购买旅程都是线性的。

我们的假设总是——如果消费者不看广告A就不会看广告B,那么消费者不看广告A也不会看广告B就不会购买。如果我们把几个转化旅程中某个环节去掉,那么这个环节之后发生的环节也不会发生,这就是我们的假设。而这个假设的因果逻辑是有缺陷的说不定这个环节仅仅起到了干扰的作用。
再举个极端的例子,如果你发现所有你的产品的购买者都看过你的竞争对手的广告,根据你的模型该竞争对手的广告获得的“功劳”最多,那么你会对竞争对手说,“你接着投放,钱我来出”这样的昏话吗?这就好比说“所有死了的人都曾经活过,所以活着是死亡的最大原因”一样鱼唇。
笔者最近就因为收到了建行推销ETC服务的短信办了工行的ETC,这并不是那么“极端”的场景呢!
为什么这对营销很重要?
通过上面的论述,我们一方面证明了为什么像马尔科夫链这样的决策树模型要科学得多,一方面也揭示了粗暴地进行归功模型往往不能将转化的影响因素体现出来。
反过来说,如果您知道哪些接触点影响了用户,以及他们对您的每一个销售的决策影响了多少——那么你才真正做到了归因。如果你误解了因果关系的相关性,那么你可能会将你宝贵的营销预算用于没有推动任何提升的广告。
也正是因为转化路径的复杂,你在仅仅考虑“接触点在哪里”、“接触点的顺序如何”、“接触点的渠道和场景”、“接触的频次”而没有考虑“接触的质量”,“接触的实际影响力”这些更深层次的指标时无法将“归功”转化为“归因”。

虽然归因的概念在数字营销中已经引入超过十年了,“一切可衡量”的数字营销好像与归因是“天作之合”。但现阶段我们所能够触及的工具只能在有限的场景中对归因进行分析,比如单一的PPC渠道中,而对复杂的且无法确切衡量接触“强度”的场景,如MTA(Multi-touch Attribution),使用归功的方法有很大的风险。
参与归功的各个影响因素很难保证对最终转化有正面影响,这就是现阶段归功的局限性。Commerce Signals的CMO Nick Mangiapane也说:“尽管MTA的复杂性上升,但依旧无法衡量增量”(MTA, despite its increased complexity, cannot measure incrementality)。连Forrester都认为MTA是“幻灭的深渊”(trough of disillusionment)。
作为一个Data-Driven的数字营销者,往往忽视广告创意的潜在价值。这是另一个我们必须要反思和深思的地方。或许这是为什么那些4A公司和内容创作者们还活得挺不错的原因吧。