第42章
Sitemaps
索引文件使用以下 XML 标记:
第92 页
----------------------- Page 101-----------------------
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
loc
lastmod
sitemap
sitemapindex
注:Sitemaps 索引文件只能指定与其位于同一网站的 Sitemaps 。例如,
http://yoursite/sitemap_index.xml 可包含位于http://yoursite 的
Sitemaps,但不能包含位于http://example 或http://yourhost.yoursite 的Sitemaps。
与 Sitemaps 一样,你的 Sitemaps 索引文件应为UTF-8 编码。
6、XML Sitemaps 索引示例
下例展示了一个 XML 格式的 Sitemaps 索引。该 Sitemaps 索引列出了两个 Sitemaps:
http://example/sitemap1.xml.gz
2004-10-01T18:23:17+00:00
http://example/sitemap2.xml.gz
2005-01-01
备注:与 XML 文件中的所有值一样,Sitemaps 网址需要实体换码。
Sitemaps 索引 XML 标记定义
需要有 标记并用其来识别 Sitemaps 的位置。
标记是可选标记,用于指示相应 Sitemap 文件的修改时间。它并不
对应于该 Sitemap 中列出的任一网页的更改时间。lastmod 标记的值应采用
W3C Datetime 格式。通过提供最近修改的时间戳启用搜索引擎抓取工具,抓
取工具将只检索索引中的 Sitemaps 的一个子集,也就是说,抓取工具只检索
某特定日期之后修改的 Sitemaps。通过这一递增的Sitemaps 提取机制,可以
快速发现超大型网站上的新网址。
标记封装单个 Sitemaps 的相关信息。
标记会压缩有关文件中的所有 Sitemaps 的信息。
7、Sitemaps 文件的位置
Sitemaps 文件的位置决定该 Sitemaps 中所能包含的一组网址。位于
http://example/catalog/sitemap.gz 的Sitemaps 文件可包含以http://example/catalog/开
始的任何网址,但不能包含以http://example/images/开始的网址。
如果有更改http://example.org/path/sitemap.gz 的许可,你应该也可以提供以
http://example.org/path/作为前缀的网址的信息。
第93 页
----------------------- Page 102-----------------------
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
http://example/catalog/sitemap.gz 中,被认为有效的示例网址包括:
http://example/catalog/show?item=23
http://example/catalog/show?item=233&user=3453
http://example/catalog/sitemap.gz 中被认为无效的网址包括:
http://example/image/show?item=23
http://example/image/show?item=233&user=3453
https://example/catalog/page1.html
被认定为无效的网址将不再考虑。强烈建议将 Sitemaps 放置在Web 服务器的根目录处。
例如,如果Web 服务器位于example,则Sitemaps 索引文件应位于
http://example/sitemap.gz 。在某些情况下,你需要针对不同的路径创建对应的Sitemaps,
例如,如果在你的组织中,安全许可对应不同目录划分上传权限。
8、验证你的Sitemaps
Google 使用 XML 架构定义可以出现在 Sitemaps 文件中的元素和属性。你可从
以下链接下载此架构:
对于 Sitemaps: http://google/schemas/sitemap/0.84/sitemap.xsd
对于 Sitemaps 索引文件:http://google/schemas/sitemap/0.84/siteindex.xsd
有多种工具可帮助你根据此架构来验证你的 Sitemaps 结构。在下面的每一个位置
你都可以找到 XML 相关的工具列表:
http://w3.org/XML/Schema#Tools
http://xml/pub/a/2000/12/13/schematools.html
为了根据某个架构验证你的Sitemaps 或 Sitemaps 索引文件,XML 文件需要有附
加的标头。如果你使用的是 Sitemaps 生成器,这些标头已经包含其中。如果你使用不
同的工具创建 Sitemaps,XML 文件中的标头应如下例所示。
Sitemaps: