第65章
不过在9 月5 日,Business 遇到一件蹊跷之事:它的首页由PR8 变成了PR0,而且Google
搜索结果中找不到首页。好在被“蒸发”的只是首页,并且庆幸的是第二天首页又回到了
Google 的搜索结果,但PR 仍旧为0。
Business 的问题出在它的重定向命令上。该网站让 business 跳转到
http://business/,这种重定向本该是永久性的。而 302 则属于临时性重定向,只有
当一个网站或网页在 24 到 48 小时之内临时移到其它位置的情况下才能使用该命令。但
Business 却错误地使用了“HTTP/1.1302 Object Moved”状态码。
其实网站重定向极为普遍,譬如不满意原来的域名而申请了一个新域名;买下容易被人
错拼的域名,防止客户因为拼错 URL 而找不到网站,等等。可是,很多人却会由于使用了
错误的重定向状态码而遭“灭站之灾”,就像Business。尽管他们的重定向理由充分合
理,然而若使用不当,就可能被 Google 误认为是利用多个域名指向同一网站,那么你的网
站就会被封掉,罪名是“利用重复的内容来干扰 Google 搜索结果的网站排名”。大多数使
用错误重定向参数的网站没Business 这么幸运,一个小小的重定向就可能使网站前功尽
弃,只能从头来过:重新申请新域名,重新发布新网站,等等。记住:Google 绝不会同情
任何人,即使是无心犯下的错误。
2、302 重定向和网址劫持(URL hijacking)
从网址A 做一个302 重定向到网址B 时,主机服务器的隐含意思是网址A 随时有可能
改主意,重新显示本身的内容或转向其他的地方。大部分的搜索引擎在大部分情况下,当收
第 161 页
----------------------- Page 170-----------------------
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
到302 重定向时,一般只要去抓取目标网址就可以了,也就是说网址B。如果搜索引擎在遇
到302 转向时,百分之百的都抓取目标网址B 的话,就不用担心网址URL 劫持了。
问题就在于,有的时候搜索引擎,尤其是 Google,并不能总是抓取目标网址。比如说,
有的时候A 网址很短,但是它做了一个302 重定向到B 网址,而B 网址是一个很长的乱七
八糟的URL 网址,甚至还有可能包含一些问号之类的参数。很自然的,A 网址更加用户友
好,而B 网址既难看,又不用户友好。这时Google 很有可能会仍然显示网址A 。
由于搜索引擎排名算法只是程序而不是人,在遇到 302 重定向的时候,并不能像人一样
的去准确判定哪一个网址更适当,这就造成了网址URL 劫持的可能性。也就是说,一个不
道德的人在他自己的网址A 做一个302 重定向到你的网址B,出于某种原因, Google 搜索
结果所显示的仍然是网址A,但是所用的网页内容却是你的网址B 上的内容,这种情况就
叫做网址URL 劫持。你辛辛苦苦所写的内容就这样被别人偷走了。
302 重定向所造成的网址URL 劫持现象,已经存在一段时间了。不过到目前为止,似
乎也没有什么更好的解决方法。在正在进行的大爸爸数据中心转换中,302 重定向问题也是
要被解决的目标之一。从一些搜索结果来看,网址劫持现象有所改善,但是并没有完全解决。
四、404 重定向
1、404 设置
在 IIS 中设置 404 网页:点击网站属性→自定义错误信息→找到 404 了→双击→选
“URL ”→在下面输入自定义的404 页面URL 。
一般而言,从技术上设置404 错误导航并不复杂,关键是404 错误页面本身的设计。
比较理想的情况下是给出出错提示,列出站点主要内容导航,及给予用户一个错误URL
的提醒,同时方便用户浏览页面,增加用户友好程度。这一点可以学习dell (如下图)。
对于已经不存在的目录可以用robots 文档限制搜索引擎抓取。
第 162 页
----------------------- Page 171-----------------------
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
图12-5-1 Dell 的错误页面导航
2、可能导致错误的404
定义 404 错误页面,切记还需要禁止搜索引擎对该错误页面进行抓取。具体见 robots
协议。因为404 错误不能直接定向到站点的每一页面,而是需要按照上面的参考案例精心设
计页面。以下抓图是某站点,因为错误页面直接重定向到站点首页,而站点首页是没有禁止
收录,导致搜索引擎重新收录了这些页面。产生了大量类似页面。
在yahoo 收录的页面中,我们发现了yahoo 收录了大量已经不存在的页面,而且收录的
这些页面跟首页都是一模一样的。
第 163 页
----------------------- Page 172-----------------------
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
图12-5-2 Yahoo 收录页面
这些不存在的页面都定制了401 错误页面,而这个错误页面恰好就是 9tour.cn 的首页。
这些页面以前都存在,在变成404 错误页面后,Yahoo 继续把定义的错误页面当作了内容抓
取。这样的后果是,对于Yahoo 而言,该站点存在大量完全一样的页面,有非常严重的堆积
页面的嫌疑。
五、其他重定向
1、JS
这一代码被黑帽 SEO 广泛使用。JS 的主要作用是将一作弊页面优化上去后,迅速重定
向到目标页面,由于搜索引擎对JS 的识别有限,这种代码能避免被搜索引擎惩罚。
一般情况下,这种代码有两种方法:一种是直接将Javascript 代码放在页面的Html 代码
中,另一种是将Javascript 代码放到外部JS 文件,而在Html 代码里调用该JS 文件了。
第 164 页
----------------------- Page 173-----------------------
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
这种Javascript 代码种类非常多。下面是一段Javascript 代码。我们将其存放在跟页面处
于同一目录的abc.js 文件里。