百度的站内搜索和SEO

许多SEO都知道搜索引擎大都有个站内搜索。就拿百度来说你可以去zn.baidu.com进行申请。站内搜索和网页搜索显然是不同的,这里的不同之处并不仅仅在于结果的范围。极诣在本文将比较两者的区别和对SEO的启示。

通过站内搜索提升SEO?

通过站内搜索提升SEO?

两种不同的过滤网站的方法

我们知道百度搜索框下面有一个搜索工具,可以通过下图所示百度在SERP上提供的工具进行筛选。

在搜索框下可以找到网站过滤的选项

在搜索框下可以找到网站过滤的选项

我们尝试输入bbs.a9vg.com。这是一个著名的游戏论坛的域名。我们会得到一个结果。

仅通过工具进行site过滤

仅通过工具进行site过滤

这里请注意,我们在搜索结果中依然看到了99单机、91单机、游侠网这些结果。查阅一下源代码我们发现了一些srcid(Source ID)。1599是自然搜索的普通网页结果,1533是自然搜索的普通论坛帖子的结果。其他都是特殊来源(不要问特殊来源为什么那么牛X)。

srcid的解释了各条结果的来源

srcid的解释了各条结果的来源

查看当前URL,我们发现【https://www.baidu.com/s?wd=伊苏8&si=bbs.a9vg.com&ct=2097152】具有同样效果,这里的si和ct参数必须一一对应缺一不可。当缺失时或者不匹配时,过滤将不起作用。ct=0时为不添加过滤的默认搜索。

各位SEO对网页搜索的site:【域名】运算符一定不陌生。它限制了网页搜索的范围。接下来我们测试一下在搜索框中直接输入site:bbs.a9vg.com的运算符。如下图所示,我们发现上述我们手动更改的范围现在自动应用了。

我们在搜索框中使用site:运算符

我们在搜索框中使用site:运算符

显然前后两个SERP尽管都应用了域名过滤,但是结果却不尽相同。不但这次那些特殊来源的结果没了,而且结果的排名顺序也改变了。那么问题来了网页搜索哪家强?我们为了求证排名的可靠性去掉了所有的过滤,最终在第七页SERP找到了第一条bbs.a9vg.com的结果。这条结果和不使用site:的结果一致。

取消过滤后在第7页找到最终结果

取消过滤后在第7页找到最终结果

从相关性来看,显然前者要更优。site:运算符并不太靠谱。当然,这是笔者主观的第一感觉。

默认的站内搜索=网页搜索运算符site:

我们接下来看看正儿八经的站内搜索的情况。

站内搜索的结果与site:运算符结果一致

站内搜索的结果与site:运算符结果一致

结果没有太出乎我们的意料,站内搜索的结果和排名甚至主题图片与使用site:运算符完全一致。反过来仅用工具来过滤的那条专区主题页面仅出现在这里的第10条结果中(上述截屏中仅至第9条)。于是我们心中出现了一个巨大的问号:站内搜索真的好用吗?

另外我们注意到第7条和第1条是同一个页面,笔者检查了该页面,该页面正确使用了canonical标签,URL指向的是第7条的静态地址。笔者又用一般的网页搜索进行了检查同样得到两条结果。不管是站内搜索还是一般的百度搜索都不适用Canonical标签。重复的页面都获得较高排名。那么是不是百度搜索中页面排序与页面被发现时间有关呢?(首先发现时,使用的是动态URL)。

注意框出的URL和回复数量

注意框出的URL和回复数量

再来比较一下站内搜索:

这次和普通搜索结果非常相似

这次和普通搜索结果非常相似

我们知道的,我们被告知的和我们不知道的

SEO的世界里关于知识一共有这三种情况。首先是我们知道的,比如Page Title很重要;然后是我们被告知的,比如站内搜索可以提高索引几率;最后是我们不知道的,比如百度是否可以对schema.org数据进行支持。当搜索引擎推动某项新特性时,我们总是会被告知采用这些规范能获得的回报。诸如,要这样做,这样你的页面更友好;不要那样做,那样会受惩罚。

从以上的实验中,我们发现site:运算符和站内搜索对关键字排名的状况确认并不是很有用。因为它不但新建了一个库(如,站内搜索可以强制索引网页搜索未收录的页面),而且用了一套不一样的算法。我们知道搜索引擎有多达300多个影响因素来决定排名,我们假设站内搜索和一般的网页搜索使用了类似的算法,算法的不同之处在于一些影响因素在站内搜索中未被考虑。那么我们如何再深入探索其中区别呢?

从另一个角度来看,如果站内搜索的结果代表了仅采用100/300个影响因素的半成品排名,那么是不是说明某些页面存在了一些问题呢?比如那条排在站内搜索第10名的那条结果是如何半程失利却又在最后翻盘的呢?这是个非常有趣的问题。

我们先罗列一下我们的假设:

  1. 站内搜索不考虑外链给各页面带来的正面影响
  2. 站内搜索不考虑网站中的页面结构所带来的影响
  3. 不管是不是站内搜索百度都并不重视canonical标签

除了第三条,极诣无法证明那是对的。但是极诣愿意相信,从高搜索量词和长尾词的前后对比,前两条为真的可能性非常高。如果为真,那么这样的结果能够给bbs.a9vg.com站长提供的信息是什么呢?bbs.a9vg.com在外链建设方面的情况尚可,但是在页面本身的优化是相当不足的。

我们看一下其竞争对手游民星空的情况。游民星空在“伊苏8”这个词的第1页SERP占据了3个结果。是这个词表现最好的网站。

一般搜索和站内搜索的表现相似度较高

一般搜索和站内搜索的表现相似度较高

极诣的推论是,游民星空的页面内优化相当出色。这其中重要的网页质量,也是a9vg的站长要学习和反思的。

前面极诣提到站内搜索会新建一个库,其实是不准确的。现在我们回过来解释一下站内搜索的库到底和总索引库有什么关联。实际上站内搜索使用的是总库+附加的页面。我们可以看到一天内某网站对于某关键字的两个SERP的表现,每隔一小时刷新一次。得到的结果会是一致的。如果你的页面未被总索引库索引,从极诣的使用百度站内搜索的体会来说,通过站内搜索提交附加页面被总索引库索引的机会微乎其微。也就是说,我们被告知的并不一定为真。

相似度越高,页面内SEO优化越好

通过以上的具体实例,极诣得出的推论是站长想要了解自身网站SEO的部署情况时可以通过热门词的站内搜索(并不需要开通站内搜索)来进行比较。排名相似度越高,说明你的单个页面SEO做得越好。这也是极诣通过一个实例向大家介绍SEO研究的正确方法。

这是站内搜索的一个另类应用,即帮大家诊断SEO的表现。站内搜索在一些电子商务网站上也有它的作用。我们知道SEM中的质量度除了广告的点击率和页面与关键字的相关度关系密切。如何批量地返回关键字的最匹配着陆页呢?站内搜索可以帮你。具体的做法极诣先卖个关子,我们今后再探讨。感谢关注极诣。