乐读窝

搜索引擎优化魔法书

乐读窝 > 科幻小说 > 搜索引擎优化魔法书

第65章

书籍名:《搜索引擎优化魔法书》    作者:姚志国


                                    

        不过在9  月5  日,Business  遇到一件蹊跷之事:它的首页由PR8  变成了PR0,而且Google

        搜索结果中找不到首页。好在被“蒸发”的只是首页,并且庆幸的是第二天首页又回到了

        Google  的搜索结果,但PR  仍旧为0。

        Business  的问题出在它的重定向命令上。该网站让  business                                            跳转到

        http://business/,这种重定向本该是永久性的。而  302  则属于临时性重定向,只有

        当一个网站或网页在  24                    到  48    小时之内临时移到其它位置的情况下才能使用该命令。但

        Business  却错误地使用了“HTTP/1.1302  Object  Moved”状态码。

        其实网站重定向极为普遍,譬如不满意原来的域名而申请了一个新域名;买下容易被人

        错拼的域名,防止客户因为拼错  URL  而找不到网站,等等。可是,很多人却会由于使用了

        错误的重定向状态码而遭“灭站之灾”,就像Business。尽管他们的重定向理由充分合

        理,然而若使用不当,就可能被  Google  误认为是利用多个域名指向同一网站,那么你的网

        站就会被封掉,罪名是“利用重复的内容来干扰  Google  搜索结果的网站排名”。大多数使

        用错误重定向参数的网站没Business  这么幸运,一个小小的重定向就可能使网站前功尽

        弃,只能从头来过:重新申请新域名,重新发布新网站,等等。记住:Google                                                            绝不会同情

        任何人,即使是无心犯下的错误。

        2、302  重定向和网址劫持(URL  hijacking)

        从网址A  做一个302  重定向到网址B  时,主机服务器的隐含意思是网址A  随时有可能

        改主意,重新显示本身的内容或转向其他的地方。大部分的搜索引擎在大部分情况下,当收

        第  161  页

        -----------------------  Page  170-----------------------

        搜索引擎优化魔法书  SEO  Magic  Book    浩维互动免费电子书  timev

        到302  重定向时,一般只要去抓取目标网址就可以了,也就是说网址B。如果搜索引擎在遇

        到302  转向时,百分之百的都抓取目标网址B  的话,就不用担心网址URL  劫持了。

        问题就在于,有的时候搜索引擎,尤其是  Google,并不能总是抓取目标网址。比如说,

        有的时候A  网址很短,但是它做了一个302  重定向到B  网址,而B  网址是一个很长的乱七

        八糟的URL  网址,甚至还有可能包含一些问号之类的参数。很自然的,A  网址更加用户友

        好,而B  网址既难看,又不用户友好。这时Google  很有可能会仍然显示网址A  。

        由于搜索引擎排名算法只是程序而不是人,在遇到  302  重定向的时候,并不能像人一样

        的去准确判定哪一个网址更适当,这就造成了网址URL  劫持的可能性。也就是说,一个不

        道德的人在他自己的网址A  做一个302  重定向到你的网址B,出于某种原因,    Google  搜索

        结果所显示的仍然是网址A,但是所用的网页内容却是你的网址B  上的内容,这种情况就

        叫做网址URL  劫持。你辛辛苦苦所写的内容就这样被别人偷走了。

        302  重定向所造成的网址URL  劫持现象,已经存在一段时间了。不过到目前为止,似

        乎也没有什么更好的解决方法。在正在进行的大爸爸数据中心转换中,302  重定向问题也是

        要被解决的目标之一。从一些搜索结果来看,网址劫持现象有所改善,但是并没有完全解决。

        四、404  重定向

        1、404  设置

        在  IIS  中设置  404        网页:点击网站属性→自定义错误信息→找到  404                                        了→双击→选

        “URL  ”→在下面输入自定义的404  页面URL  。

        一般而言,从技术上设置404  错误导航并不复杂,关键是404  错误页面本身的设计。

        比较理想的情况下是给出出错提示,列出站点主要内容导航,及给予用户一个错误URL

        的提醒,同时方便用户浏览页面,增加用户友好程度。这一点可以学习dell    (如下图)。

        对于已经不存在的目录可以用robots  文档限制搜索引擎抓取。

        第  162  页

        -----------------------  Page  171-----------------------

        搜索引擎优化魔法书  SEO  Magic  Book    浩维互动免费电子书  timev

        图12-5-1  Dell  的错误页面导航

        2、可能导致错误的404

        定义  404      错误页面,切记还需要禁止搜索引擎对该错误页面进行抓取。具体见  robots

        协议。因为404  错误不能直接定向到站点的每一页面,而是需要按照上面的参考案例精心设

        计页面。以下抓图是某站点,因为错误页面直接重定向到站点首页,而站点首页是没有禁止

        收录,导致搜索引擎重新收录了这些页面。产生了大量类似页面。

        在yahoo  收录的页面中,我们发现了yahoo  收录了大量已经不存在的页面,而且收录的

        这些页面跟首页都是一模一样的。

        第  163  页

        -----------------------  Page  172-----------------------

        搜索引擎优化魔法书  SEO  Magic  Book    浩维互动免费电子书  timev

        图12-5-2  Yahoo  收录页面

        这些不存在的页面都定制了401  错误页面,而这个错误页面恰好就是  9tour.cn  的首页。

        这些页面以前都存在,在变成404  错误页面后,Yahoo  继续把定义的错误页面当作了内容抓

        取。这样的后果是,对于Yahoo  而言,该站点存在大量完全一样的页面,有非常严重的堆积

        页面的嫌疑。

        五、其他重定向

        1、JS

        这一代码被黑帽  SEO  广泛使用。JS  的主要作用是将一作弊页面优化上去后,迅速重定

        向到目标页面,由于搜索引擎对JS  的识别有限,这种代码能避免被搜索引擎惩罚。

        一般情况下,这种代码有两种方法:一种是直接将Javascript  代码放在页面的Html  代码

        中,另一种是将Javascript  代码放到外部JS  文件,而在Html  代码里调用该JS  文件了。

        第  164  页

        -----------------------  Page  173-----------------------

        搜索引擎优化魔法书  SEO  Magic  Book    浩维互动免费电子书  timev

        这种Javascript  代码种类非常多。下面是一段Javascript  代码。我们将其存放在跟页面处

        于同一目录的abc.js  文件里。