乐读窝

搜索引擎优化魔法书

乐读窝 > 科幻小说 > 搜索引擎优化魔法书

第71章

书籍名:《搜索引擎优化魔法书》    作者:姚志国


                                    

        2、如何清除作弊行为

        要清楚作弊行为,首先必须认真阅读搜索引擎的相关规则。如果无法深刻把握搜索引擎

        的判罚尺度,则最好是选择专业的机构,对站点进行诊断,找出所有可能涉嫌作弊的地方。

        根据诊断结果,对于作弊行为或涉嫌作弊过渡针对搜索引擎而忽略用户体验的地方,进

        行改进。

        但一定要注意,并非所有的作弊行为都是可以清除的。一般而言,如果是网站本身作弊,

        比如堆积关键词等是可以很容易清除的。但对于群发链接,链接工厂等方面是很难清除的。

        因为我们几乎没有办法控制其他站点的行为。

        第四节  搜索引擎反作弊任重道远

        一、搜索垃圾永不会消失

        在与搜索引擎与垃圾网站的长期斗争中,搜索引擎总是处于守势。这不仅因为搜索引擎

        公司真正考虑搜索结果相关性和排序的只有几个人,而互联网上整天琢磨怎么对付搜索引擎

        的有几十万网站管理员。更重要的是,制造一个或几十个甚至几百个作弊网页,只要将一个

        目标网页稍作改动即可实现,并可以不断进行类似复制,而搜索引擎甄别、删除却需要相当

        的时间。这种“以一当百”,以一个网站对付数以万计作弊网站的工作,对搜索引擎而言,

        是一个巨大的人力资源投入与成本投入。

        目前,垃圾网站的新攻击方式和攻击热点,不断变化和推陈出新,spam  如蝗虫般涌来,

        搜索引擎也不断需要改变自己的应对策略。

        这一斗争过程,已完全类同于互联网的病毒与反病毒。所不同的是,制造病毒的成本有

        时会更高些,它们往往需要很高的技术门槛。而制造垃圾网站的门槛却相当低,且制作方便。

        第  178  页

        -----------------------  Page  187-----------------------

        搜索引擎优化魔法书  SEO  Magic  Book    浩维互动免费电子书  timev

        因此,作为搜索引擎,只能以最严厉的方式来应对作弊站点,尽量提高作弊后的后果严重性

        来提升作弊成本和风险。

        但在搜索中,永远会有垃圾网站的存在,因为它每时每刻都在诞生。由于垃圾网站的成

        本与收入间的巨大差异,SEO  spam  们还会勇往直前,前赴后继。而到目前为止,政府以及

        相关部门还没有对这种互联网上的“假冒伪劣”制定相应的法律制度来制约。但相信这一天

        一定会到来。

        二、搜索引擎反作弊的历程

        乱世用重典,搜索引擎在与spam  的长期战争中总是处于不利地位。当然,从某种角度

        来说,几乎是  spam  在推动着搜索引擎的进步。

        搜索引擎诞生的早期,搜索引擎们为了搜索结果能更准确,为了能把最相关的搜索结果

        排在前面,发明了meta      tag  。起初,meta      tag  是很好用的,那时候,诚实的webmaster  们如

        实地填写网站摘要,如实地列出跟他的网站最相关的关键词,搜索引擎们抓取、索引、检索

        这些诚实的meta  tag,并作为搜索结果排序的重要依据,然后,是一段相安无事的甜蜜时光。

        岁月迅速流逝,甜蜜时光挡不住资本的力量。“一旦有适当的利润,资本就大胆起来……

        有  50%的利润,他就铤而走险;有  100%的利润,他就敢践踏一切人间法律;有  300%的利

        润,他就敢犯任何罪行,甚至冒绞首的危险。”  越来越多的网站开始追求收入追求pageview,

        它们开始欺骗搜索引擎,它们在meta  tag  中塞进成堆的关键词,塞进跟自己的网站内容无关

        的但是流行的关键词。群众的力量是巨大的,搜索引擎的相关性被破坏了。

        搜索引擎们对作弊者开始第一轮反击,但是无力的,它们的做法是:在排序时更多的依

        赖网页正文而不是meta  tag  。

        作弊者以进为退,开始第二轮攻击,他们在正文中大量使用与网页背景相同颜色的关键

        词,在image  tags  中塞进关键词,在网页代码加入“看不见的注释”。

        搜索引擎开始第二轮反击,它们找到了有效的方法来过滤这些看不见的文字,取得了小

        小的胜利。

        “善良是善良者的墓志铭,卑鄙是卑鄙者的通行证”,作弊者眼见常规武器无效,开始

        利用搜索引擎的真诚。搜索引擎的  spider  是互联网上的谦谦君子,它们访问任何网站都会自

        报身份,并且查阅网站的访问规定,完全按照各网站的规矩来办事。于是,作弊者精心制作

        了两个网站,一个专供网友访问,一个专供搜索引擎访问,每当发现访问请求来自搜索引擎

        时,就返回专供搜索引擎看的能令搜索引擎满意的网页,而正常访问者只能看到另一个截然

        不同的网站。这种方法叫做cloaking。这第三轮攻击,作弊者大胜。

        1998  年3  月  1  日,分别在AltaVista、Excite、HotBot、Infoseek、Lycos  搜索当时的热门

        词汇“Monica  Lewinsky”,各搜索引擎首页居然分别有50%、30%、30%、10%、50%的搜

        索结果是spam。由此可见当时作弊者们猖獗至何等程度!

        搜索引擎们,因为它们道德上的弱点,因为有些手段不愿用,所以无法完全辨别cloaking

        网站,也就无法完全对付作弊者。搜索引擎能做的只是严厉的惩罚被发现的  spam,以警告

        作弊者,发展到今天的结果是,所有的搜索引擎对它们认定的spam  行为,只有一种惩罚:

        永久屏蔽。

        但是,严厉的惩罚从来只是无能者推卸责任的借口,而不能真正的改善状况。作弊者从

        来就不怕惩罚,当互联网狂潮来临,追求pageview  的作弊者们更是肆无忌惮。

        无可奈何的搜索引擎,只有去寻找新的相关性排序依据,只有去寻找作弊者不能控制的

        第  179  页

        -----------------------  Page  188-----------------------

        搜索引擎优化魔法书  SEO  Magic  Book    浩维互动免费电子书  timev

        排序依据,只有去网站以外寻找排序的依据,搜索引擎,真的别无选择。

        于是,开始出现了超链分析,出现了Pagerank。一个网页,说它自己是什么,它就是什

        么吗?物以类聚,如果它说的是真的,那么指向这个网页的链接应该来自具有同类内容的网

        页,所以指向这个网页的链接可以被用来验证这个网页的相关性。

        谁,最不可能出于贪婪而作弊?谁,最可能如实提供网页内容?是政府网站,和教育网

        站。所以,在超链分析中,gov  和edu  网站通常被赋予较高的排名,来自gov  和edu  的超链

        也有更高的价值。

        但是PageRank  也带来了一些不请自来的错误排序因素:新站不如旧站,小站不如大站,

        专业站不如通俗站。一个新网站,一个小网站,一个专业网站,它的内容再好,因为不可能

        迅速得到大量的超链,所以无法得到合适的排名,即使它的内容是无与伦比的。而一个历史

        悠久的老网站、大网站、通俗网站,即使它已久不更新,或者内容远不如某些小网站,却可

        以获得很高的排名。

        当超链分析刚出来时,SEO  界一片悲观论调,认为这是无法作弊的,SEO  业完蛋了(就

        像近期各搜索引擎纷纷收费,SEO    业更觉得自己前景惨淡,其实虽然搜索引擎排名市场的

        大头要给搜索引擎们,但  SEO  还是有钱赚的,毕竟,只有劳动模范有下岗的可能,从来没

        听说骗子会失业的),但是,道高一尺魔高一丈,很快SEO  们发现了对付超链分析的方法:

        做大量的网站,准备大量的链接,哪个客户出钱,所有的网页都给它一个链接。