第41章
请注意,你为页面指定的优先级不影响你的网址在搜索引擎的结果
页的排名。搜索引擎在同一网站的不同网址之间进行选择时使用此
信息,因此,你可以使用此标记来增加相对重要的网址在搜索索引
中显示的可能性。
而且,请注意为你网站中的所有网址都指定高优先级对你没什么好
处。由于优先级是相互关联的,只用于在你自己网站的网页之间进
行选择;你网页的优先级不会与其他网站的页面优先级进行比较。
3、实体转义
Sitemaps 文件为 UTF-8 编码(通常在保存文件时可以做到)。对于所有的 XML 文件,
任何数据数值(包括网址)都应对下表中列出的字符使用实体转义码。
表 6-8-3 实体转义
字 符 转 义 码
& 符号 & &
单引号 ' '
双引号 " "
大于 > >
小于 < <
此外,所有的网址(包括 Sitemaps 的网址)都应编码,以便它们所在的,以及网址转义
的 Web 服务器识别。然而,如果使用任何脚本、工具或日志文件来生成网址(除了手动输
入之外的任何方法),通常这部分已经替你完成了。如果提交了 Sitemaps 却收到 Google 无
法找到某些网址的错误消息,请查看并确保你的网址遵循RFC-3986 URI 标准、RFC-3987IRI
标准以及 XML 标准。
这是使用非 ASCII 字符(ü )以及要求实体转义的字符(&)的网址示例:
http://example/ümlat.html&q=name
这是 ISO-8859-1 编码的(用于使用该编码的服务器上的托管)以及网址转义过的同一
网址:
http://example/%FCmlat.html&q=name
这是 UTF-8 编码(用于使用该编码的服务器上的托管)且网址转义过的同一网址:
http://example/%C3%BCmlat.html&q=name
这是实体转义过的同一网址:
http://example/%C3%BCmlat.html&q=name
4、XML Sitemaps 示例
下例显示了一个 XML 格式的 Sitemaps 。示例中的 Sitemaps 包含少数网址,每一个都
用 XML 标记来识别。此示例中,为每个网址提供了一组不同的可选参数。
第91 页
----------------------- Page 100-----------------------
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
http://example/
2005-01-01
monthly
0.8
http://example/catalog?item=12&desc=vacation_hawaii
weekly
http://example/catalog?item=73&desc=vacation_new_zealand
2004-12-23
weekly
http://example/catalog?item=74&desc=vacation_newfoundland
2004-12-23T18:00:15+00:00
0.3
http://example/catalog?item=83&desc=vacation_usa
2004-11-23
你可以使用 gzip 压缩 Sitemaps 文件。压缩 Sitemaps 文件会降低对带宽的要求。请注意,
未压缩的 Sitemaps 文件不得大于 10MB 。
5、使用 Sitemaps 索引文件(对多个 Sitemaps 文件进行分组)
你可以提供多个 Sitemaps 文件,但提供的每个 Sitemaps 文件包括的网址不得超过
50,000 个,并且未压缩时不能大于 10MB (10,485,760)。这些限制条件有助于确保 Web
服务器不会因传输非常大的文件而遇到麻烦。
如果要列出超过 50,000 个网址,你需要创建多个 Sitemaps 文件。如果预计你的
Sitemaps 网址数量会超过 50,000 个或大小超过 10MB,应考虑创建多个Sitemaps 文件。
如果你的确提供了多个 Sitemaps,你可以将其列在Sitemaps 索引文件中。Sitemaps 索引文件
只能列出不超过 1,000 个 Sitemaps。
Sitemaps 索引文件的 XML 格式与 Sitemaps 文件的 XML 格式非常相似。