第38章

                                    Meta  的属性有两种：name  和http-equiv。对于搜索引擎优化人员来说，

        我们只重点关注Meta  的name  属性。

        Meta  的name  属性主要用于描述网页，对应于网页内容，以便于搜索引擎机器人查找和

        分类。其中，对于  SEO  来说最重要的是Description    （站点在搜索引擎上的描述）、Keywords

        （分类关键词）和Robots    （机器人对具体页面进行索引的情况），所以应该给每页完善Meta

        值。

        2005  年之前，Meta  部分的内容对搜索引擎优化的最终效果能起到很大作用，很多  SEO

        人员在  Meta    的Keywords  和  Description  部分泛滥堆积关键词来获得好的关键词排名，造成

        很多并不能给用户提供有价值信息的网页在搜索结果中排名很靠前，此举已经给用户的搜索

        体验造成了极大的伤害。后来，这种排名作弊行为被搜索引擎察觉，在其新一轮的算法更新

        中，搜索引擎淡化了Meta  的Keywords  和Description  部分信息在排名因素中的权重。

        虽然Meta  部分的信息没有以前那么重要，其对排名效果影响并不那么大，但是搜索引

        擎仍然会把其作为评定网页质量的一个因素，所以我们应该尽可能完善每个页面的Meta  值。

        接下来我们就介绍以上三个meta  值的书写方法：

        1、Keywords

        Keywords  的具体网页源码表现形式为：。

        Keywords    向搜索引擎说明你的网页的关键词。每个页面的源代码Keywords    的  content

        部分填写  1-3  个关键词，关键词之间请以半角逗号分来。Keywords  部分的关键词应从当前

        页面的主要展示内容信息中提炼而来。

        第  84  页

        -----------------------  Page  93-----------------------

        搜索引擎优化魔法书  SEO  Magic  Book    浩维互动免费电子书  timev

        2、Description

        Description  具体网页源码表现形式为：。

        Description  告诉搜索引擎你的站点上的页面的主要内容。Description    的content  部分文

        字内容最好控制在  100  个字符左右，行文流畅。Description  部分的内容应该是具体页面主要

        展示信息的简洁而强有力的概述。

        3、Robots

        Robots  的具体网页源码表现形式为：。

        Robots  的  content    部分文字可以填写的内容为：all、none、index、noindex、follow    和

        nofollow  。对于Robots  的content  部分填充内容有如下说明解释：

        设定为all：文件将被检索，且页面上的链接可以被查询；

        设定为none：文件将不被检索，且页面上的链接不可以被查询；

        设定为index：文件将被检索；

        设定为follow：页面上的链接可以被查询；

        设定为noindex：文件将不被检索，但页面上的链接可以被查询；

        设定为nofollow：文件将不被检索，页面上的链接可以被查询。

        一般来说，大部分网站并没有太多的内容禁止搜索引擎机器人索引，Robots                                                          的通用写

        法都是：。如果想对Robots  做一些个性化的设置，可以

        参照上面的相关说明来完善Robots  的content  部分内容。

        三、图片ALT  替换文本

        图片有一个ALT  替换文本属性，在代码中填充某一个图片的ALT  替换文本信息，如果

        这个图片在网页上显示不出来，在该图片的位置会出现替换文本的信息。

        图片的ALT  替换文本信息属性原本是考虑到残障人士（如盲人）的访问体验而准备的，

        他们在浏览网页的时候很难获取图片中的文字信息，只能通过  ALT    替换文本的描述来了解

        图片影像内容。

        搜索引擎会把ALT  部分的内容纳入整个页面的文本分析，所以建议在填写图片ALT  部

        分的内容时要灵活地在描述中布置合适的关键词。

        四、Robots.txt

        搜索引擎都有自己的“搜索机器人”（Robots），并通过这些  Robots    在网络上沿着网页

        上的链接（一般是http  和  src  链接）不断抓取资料建立自己的数据库。

        对于网站管理者和内容提供者来说，有时候会有一些站点内容，不希望被  Robots    抓取

        公开。为了解决这个问题，Robots  开发界提供了两个办法：一个是robots.txt，另一个是The

        Robots  META  标签。

        Robots  META  标签已经在前面有所叙述，这个部分我们将不再说明。

        1、什么是robots.txt？

        robots.txt    是一个纯文本文件，通过在这个文件中声明该网站中不想被  robots    访问的部

        第  85  页

        -----------------------  Page  94-----------------------

        搜索引擎优化魔法书  SEO  Magic  Book    浩维互动免费电子书  timev

        分，这样，该网站的部分或全部内容就可以不被搜索引擎收录了，或者指定搜索引擎只收录

        指定的内容。

        当一个搜索机器人访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，

        如果找到，搜索机器人就会按照该文件中的内容来确定访问的范围，如果该文件不存在，那

        么搜索机器人就沿着链接抓取。

        robots.txt  必须放置在一个站点的根目录下，而且文件名必须全部小写。

        一般来说相应的网站就会拥有一个对应的robots.txt  文件，如：

        http://w3.org/

        http://w3.org/robots.txt

        2、robots.txt  的语法

        “robots.txt  ”文件包含一条或更多的记录，这些记录通过空行分开（以CR，CR/NL，  or

        NL  作为结束符），每一条记录的格式如下所示：

        “:”。

        在该文件中可以使用#进行注解，具体使用方法和  UNIX    中的惯例一样。该文件中的记

        录通常以一行或多行User-agent  开始，后面加上若干Disallow  行，详细情况如下：

        User-agent  :

        该项的值用于描述搜索引擎robot  的名字，在"robots.txt"文件中，如果有多条User-agent

        记录说明有多个robot  会受到该协议的限制，对该文件来说，至少要有一条User-agent  记录。

        如果该项的值设为*，则该协议对任何机器人均有效，在"robots.txt"文件中，  "User-agent:  *"

        这样的记录只能有一条。