黑百度一时爽,一直黑百度一直爽

如何正确评价百度搜索引擎

黑百度一时爽,一直黑百度一直爽
黑百度一时爽,一直黑百度一直爽

前一段时间有一篇文章说,搜索引擎百度已死,这篇文章的质量并不高,中学生作文水平,却引起了非常多的讨论。为此人民日报都进行了评论,当然也反应在了纳斯达克的股价里。据说百度也因此略微收敛,降低了搜索结果中百家号文章的比例。

有好事者,还称Bing上周无法访问是由于百度流量导入,搞出这样的假新闻。

如果说搜索引擎不给你的网站、内容导流量,你就说这个搜索引擎已经死了,那岂不是滑天下之大忌?搜索引擎的使命是为了满足用户的查找信息的需求,而不是为了给您的文章给您的网站进行导流的,这不是他们的使命。如果你的网站用户体验差、内容质量差、内容与互联网上已有的内容重复,亦或是SEO做的很糟糕,那么不管是哪个引擎都不会给你带来流量的。

百家号作为百度内容生态中非常重要的一部分,百度给其进行导流,自然无可厚非,其实也出于无奈。就好像99%的微信内容,都会在微信自己的mp.weixin.qq.com上host。这些内容屏蔽了所有的搜索引擎。只有你在熊掌号(现更名为移动专区)中绑定了熊掌号和微信号以后,百度才可以正常对你的微信号的内容进行抓取。

淘宝就更有趣了,淘宝商品屏蔽了百度、360、神马,国内的引擎仅对搜狗网开一面,而对谷歌、必应、甚至毛子的Yandex敞开心扉。有兴趣可以看看淘宝的robots.txt

淘宝的robots.txt虽然写得很业余但是看得出差别对待
淘宝的robots.txt虽然写得很业余但是看得出差别对待

对于自建内容生态,百度是出于无奈,其实也是必须的。就好像谷歌也有自己的Google Post。另外谷歌的AMP页面不也是host在谷歌自己的服务器上吗?百度现在有了MIP,作为AMP的本土版。事实上很长一段时间百度发现移动端页面体验不好都“自说自话”地将网页转码,那时候却不见有人跳出来。

正由于多年耕耘,即便在谷歌上搜索一些问题,你常常还是能发现百度产品的结果。比如下面这个例子。

谷吹们又要说谷歌的“公平”了
谷吹们又要说谷歌的“公平”了

好吧,如果《已死》的作者的这篇文章是站在普通的搜索引擎用户的角度来说的,那么既然是站在普通的搜索引擎用户的角度,那么为什么文章作者不用大量的数据证明百度的搜索用户他们的搜索需求并没有被百度满足,而仅仅是拿几个例子来说明一些问题呢,如果是要例子的话,即使是谷歌,我们也可以找出很多,比如下面这个例子:

人有失足,马有失蹄
人有失足,马有失蹄

就搜索结果的准确性而言,其实我们可以非常容易找出各种例子来证明某个引擎很垃圾。但是这种方法并不能有统计意义地证明某个搜索引擎很烂,而其他搜索引擎很好,那是不公允的。

对于资讯内容来说,一般而言,百家号的页面的用户体验是高于其他大多数的页面的,特别是你在用手机百度的时候。百度曾经在过去的几年尝试过新闻源,但是带来的效果并不好。因为新闻网站良莠不齐,不能充分解决移动互联网的需求。

好吧,那或许作者是站在专业的搜索引擎研究者或从业人员的角度去讲这篇文章的呢?那又很奇怪了,作为一个搜索引擎营销行业的基层从业者,笔者看不出这篇文章的专业性,就好像不知道必应的DNS记录挂了而甩锅给百度的那些“发言人”,没有任何专业性可言。

Bing一度无法访问,现已修复
Bing一度无法访问,现已修复

要知道,百度搜索引擎的蜘蛛的活跃性几乎是超过中国其他搜索引擎蜘蛛的总和的。也就是说,对于中文网站,如果今天百度蜘蛛来爬行你一百篇文章的话,那么谷歌、必应、360、搜狗、神马、Yandex他们加起来总和也不会超过100。

你不要小看这个情况,因为这代表了百度对中文网页、中文内容、中文互联网的一种巨大的投资。这不单费水电煤,而且费带宽。带宽,这是百度的成本中非常大的一块。每季度十几亿,占总营收8%。

所以百度的整个索引量非常之大。这也就是为什么,在中国百度依然是我们搜索引擎中最能够满足用户搜索需求的搜索引擎。因为它索引的页面多啊。即便有那么多广告,即便广告几乎占了首屏,即便有许多百家号、百度知道、百度经验这些内容在那里,用户还是选择百度。

说了那么多,既然要评价,我们来聊聊百度的不足之处。

首先是对原创内容的保护,这方面虽然去年百度非常大地加强力度,但是目前的效果还是比较让人担忧的。去年百度资源平台做了一个《寻找采集大王》的活动,活动的初衷是不错,但是如果搜索引擎还需要人肉来找到采集的内容,那么搜索引擎的AI,所谓的智能和算法到底体现在哪里呢?笔者有很多文章被洗去品牌抄袭,个别在百度上排名,甚至比原创的文章还要高。

如何证明原创和抄袭的工作应该交由搜索引擎而不是用户举证
如何证明原创和抄袭的工作应该交由搜索引擎而不是用户举证

第二是百度过于激进地去推广自家的百家号。推广百家号的目的和推出百家号的目的形成了巨大的落差,最终变成了是为了推广手机百度而不是让用户获取信息更便捷。百家号最终变成了败家号。百家号的优点是它的打开速度快,内容获取比较轻松。但是你没有用手机百度的话可能就不是这样了。比如下面这个例子,但是如果你在非百度手机浏览器上,想要展开继续阅读的话,就会出现一些问题。

己所不欲勿施于人
己所不欲勿施于人

上面这个例子和《百度移动搜索落地页体验白皮书4.0》中3.3.1.4.1的负面例子如出一辙。此外,还存在自动调起手机百度这样打脸的违规行为。

第三是百度的搜索结果的违法内容隐患,这给百度带来潜在的法律风险。百度的搜索结果页面(SERP),只要看过代码就知道,绝对是全世界最复杂的。毕竟广告样式就五花八门。代码的规范性也是各式各样,毕竟是经手了大量工程师。但这些不是问题,问题是页面上还是有许多盗版软件的内容,或者说盗版软件平台在近二十年后依然在搜索引擎上占一席之地。另外在对于医药行业来讲,百度的搜索结果上还有许多仿制药,假药,代购药的结果,这些会严重的影响患者的生命安全。

多条结果中为提供非法序列号的下载
多条结果中为提供非法序列号的下载

第四,前面也提到了,百家号的浏览体验会比一般的第三方网站浏览体验要好一些。由于腾讯阿里对百度实行封闭,因此,百家号之于百度是内容战略的一个突破口。但是百家号本身它的SEO做得是非常糟糕的。我们从下图就可以比较出百家号在百度和谷歌的索引量,谷歌索引的连0.3%都不到。

百家号的谷歌和百度索引量对比
百家号的谷歌和百度索引量对比

百家号的问题在于它的可爬取性,URL结构上。这也是为什么你虽然可以在谷歌上看到不少百度百科、百度经验、百度知道,却很少看到百家号内容的原因。因此所谓的“从这里影响世界”,在现阶段只是梦想罢了。

最后第五点,依然是广告。广告的条数,虽然在2016年的那次事件后有所减少,但是每条广告所占的区域却越来越大。你不需要8条广告来占领桌面端的首屏,5条就够了。这就是为什么我们去搜索一些商业意图非常明显的关键词的时候,看到满屏的都是广告。

综上,我们可以这样说百度依然是中文搜索中最优秀的搜索引擎,离死尚远。但是百度并非无懈可击,依旧有许多诟病的地方。当年轻一代逐渐成为互联网的主角,雅虎日本,Yandex,Naver这些各自领域曾经同样占领大部分市场份额如今却逐渐成为各个市场中的跟随者后,百度应该清醒现时的优势并不能铸就长久的霸主位置。笔者写下这些文字,也是希望BAT中最为开放的百度可以走得更远,让用户满意,让从业者自豪

类似文章