Paywall、付费阅读，怎样薅知识羊毛？

付费阅读、为知识付费是当今普遍内容变现的手段。把有价值的内容藏在付费流程之后被称为Paywall，极诣在2018年《互联网人必须知道的六面“墙”》一文中曾经介绍。但是这种方式会使得搜索引擎也被挡在Paywall之外，这样搜索引擎无法获取内容，因此也无法判断内容的价值。这会让网页排名能力下降。

那么作为媒体应该如何在网页中配置付费内容呢？这知识羊毛又该如何防薅呢？我们通过一个例子来深入介绍。

Campaign Asia是许多广告代理从业者经常关注的媒体，要阅读内容你必须进行注册。但登录后你只能每月免费阅读三篇文章。

每年180刀并不是每个同学都能承受的。那么如何绕过Paywall呢？我们先把这个问题放一下，讲点SEO。

谷歌为了这些在Paywall之后的内容提供了结构化数据的方案。基本思路是谷歌可以免费看到付费内容并由此判断是否值得收录并排名，一般用户看不到付费部分。这个“两全其美”的方式由结构化数据实现。具体方案在谷歌开发者的文档中有详细描述。

{
  "@context": "https://schema.org",
  "@type": "NewsArticle",
  "mainEntityOfPage": {
    "@type": "WebPage",
    "@id": "https://example.org/article"
  },
  (...)
  "isAccessibleForFree": "False",
  "hasPart": {
    "@type": "WebPageElement",
    "isAccessibleForFree": "False",
    "cssSelector": ".paywall"
  }
}

上面是应用JSON-LD实现结构化数据的代码段，其中第二部分规定了藏在Paywall之后的内容端。

<p>这是在Paywall之外的文字，对所有人可见。</p>
<div class="paywall">这是隐藏在Paywall之后的文字，仅对订阅用户可见。你也可以通过css来调整它的可见性。这里的class对应JSON-LD中的cssSelector字段。</div>

我们应用Google的Rich Results Test工具就能验证Campaign Asia其实也用了这个结构化数据：

接下来我们去网页代码中看看是否他们隐藏了付费部分的内容，结果并未找到。这说明该网站对搜索引擎和用户伺服不同的内容！

为了验证该网站采用了cloaking的技术，极诣去查看了谷歌搜索引擎的快照：

看来薅羊毛已经有思路了，那么作为媒体如何堵住这个漏洞呢？首先当然是防止搜索引擎保存快照。可以采用noarchive的搜索引擎指引。如：<meta name=”robots” content=”noarchive” />

但这样并没有卵用，这是挡不住极诣的读者群的。仅仅改变浏览器的User-agent，改成搜索引擎爬虫便可轻松无限浏览网页的完整内容。

最简单方式是采用安装一个User-Agent Switcher for Chrome的插件，自定义一个Google爬虫的UA，如：Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)。开启后打开网页，然后通过网址前的“小锁”block所有cookie。不到一分钟你就可以畅游年费180刀的网站了。

为了SEO的效果就必须让搜索引擎了解你的网页到底有没有价值，到底是标题党还是干货。那么媒体就没有办法防薅了吗？其实未必，媒体需要打开防火墙对爬虫进行鉴别，即便是声称为谷歌蜘蛛的爬虫也要验证其IP或域来进行干预。这才能有效防薅。

总结一下，我们介绍了如何使用结构化数据对Paywall后的内容进行SEO优化。极诣指出网站的这些漏洞并非鼓励大家去绕过Paywall。我们尊重知识产权和著作权，这些在Paywall后的内容是媒体赖以生存的资产，是媒体选择减少广告对用户体验打扰的另一选择。薅羊毛并不是一件光彩的事，不给看可以去别处看嘛，不是吗？

类似文章

搜索引擎优化|搜索引擎营销|数字营销

是什么阻碍百度跻身超一流互联网公司？
作者Hermes Ma 2014年4月23日2018年10月9日

百度在其站长平台发布了WordPress插件。我们很遗憾地看到这个姗姗来迟的WP插件频繁地出现bug，绝大部分网站出现sign检测失败无法验证，至今两个多月后仍然无法使用。

阅读更多是什么阻碍百度跻身超一流互联网公司？
搜索引擎优化|数字营销

百度的站内搜索和SEO
作者Hermes Ma 2016年8月27日2017年5月13日

许多SEO都知道搜索引擎大都有个站内搜索。许多站长认为站内搜索可以提升页面收录，这是真的吗？站内搜索对SEO乃至SEM还有什么借鉴意义，极诣将通过一个实例为你揭秘。

阅读更多百度的站内搜索和SEO
数字广告|数字营销

明年的营销预算该怎么花？如何花得聪明？
作者Hermes Ma 2020年11月18日

又到年底，困扰营销者们的“经典问题”又回来了——明年的营销预算应该怎么分配？应该申请多少营销预算来实现期望的KPI。经历了大多数人都想重启的2020年，每个品牌都在数字营销领域有了许多心得和教训，本篇极诣将与读者们共同探讨这一命题，为读者提供一些思路。

阅读更多明年的营销预算该怎么花？如何花得聪明？
数字分析|数字营销

99%的Google Analytics用户不知道转化到底有多少
作者Hermes Ma 2019年10月9日

Google Analytics中充满了许多陷阱，初学者一不留神你就会获得“意味不明”的数据。一些数据连资深用户都无法解释。极诣将通过一个实例带你探索GA中那些神秘的“转化数”。

阅读更多 99%的Google Analytics用户不知道转化到底有多少
搜索引擎优化|数字营销

网页多快才算快？谷歌发布核心网页指标Core Web Vitals
作者Hermes Ma 2020年6月3日2020年6月6日

💯在谷歌推出核心网页指标Core Web Vitals之前，极诣虽然多次讨论网页加载速度的衡量和提升方法，但是由于业界一直没有一个权威的指标，很难对网页加载速度有一个合理的衡量。这次更新有哪些不一样呢？请继续阅读。

阅读更多网页多快才算快？谷歌发布核心网页指标Core Web Vitals
搜索引擎营销|数字营销

Google，Amazon，Bing，Yahoo，Facebook – 美库尔18Q3数字营销报告
作者Hermes Ma 2018年10月31日2018年11月17日

业界最权威和全面的第三方数字营销报告又出炉了。美库尔上周发布了2018年三季度的数字营销报告。如往期一样，报告揭示了三季度包括谷歌、脸书、亚马逊、必应、雅虎等主流媒体的各大指标趋势。各家成绩单如何，我们一看究竟。

阅读更多 Google，Amazon，Bing，Yahoo，Facebook – 美库尔18Q3数字营销报告