Sitemap
sitemap又称“网站地图”,是展示一个网站结构、栏目和内容说明等基本信息的文档,就像人们对一个陌生城市的了解需要借助于城市地图一样,对于一个网站信息的快速了解也可以借助于网站地图进行。
网站地图的作用[ ]
网站地图的作用,除了为用户快速了解网站结构和内容提供方便之外,更重要的一个作用是,方便搜索引擎收录网站中的内容页面,搜索蜘蛛都会先通过网站地图的链接来进入深层次网页,符合规范的网站地图对于网站的搜索引擎优化有很大的帮助。就好像为网站提供了整站的RSS,而搜索引擎就是这些RSS的订阅者,只要网站有更新就会自动通知搜索引擎。这样一来,搜索引擎的收录你的网站由被动变成了主动。
Google Sitemap[ ]
Google Sitemap是Google网站管理员工具中的一项服务。通常称为 Sitemap(使用大写 S),是向 Google 提供有关网站信息的一种方法。创建并提交 Sitemap 有助于确保 Google 知道您网站上的所有网页,包括 Google 的正常抓取过程可能无法找到的网址。
Google推出的Sitemap,是对原来robots.txt的扩展,Google Sitemaps有助于加速网页的查找。
适合使用Google Sitemap的情况[ ]
- 网站含动态内容。
- 网站有不容易被 Googlebot 在抓取过程中发现的页面,如有大量富 AJAX 或 Flash 内容的页面。
- 网站为新网站且指向网站的链接不多。 (Googlebot 会跟随链接从一个网页到另一个网页抓取网络,因此,如果您的网站没有很好地链接,我们可能很难发现它。)
- 网站有大量内容页存档,这些内容页相互没有很好地链接,或根本就没有链接。
可提交的其他内容[ ]
- 您网站上网页的更改频率。 例如:您可能每日都更新产品页,但每几个月才更新"我的简介"页一次。
- 各网页上次修改的日期。
- 您网站上各网页的相对重要性。 例如:主页的相对重要性为 1.0,类别页的相对重要性为 0.8,而个人博客条目或产品页的相对重要性则为 0.5。这个优先级只是说明特定网址相对于您网站上其他网址的重要性,并不会影响您的网页在搜索结果中的排名。
Sitemap格式[ ]
Sitemaps 协议格式由 XML 标记组成。Sitemaps 的所有数据数值应为实体转义过的。文件本身应为 UTF-8 编码的。 以下是只包含一个网址并使用所有可选标记的 Sitemaps 示例。可选标记为斜体。
<?xml version="1.0" encoding="UTF-8"?> < urlset xmlns="http://www.google.com/schemas/sitemap/0.84"> < url> < loc>http://www.example.com/</loc> < lastmod>2005-01-01</lastmod> < changefreq>monthly</changefreq> < priority>0.8</priority> </url> </urlset>
Sitemaps 应:
- 以 <urlset> 开始标记开始,以 </urlset> 结束标记结束。
- 每个网址包含一个作为父标记的 <url> 条目。
- 每一个 <url> 父标记包括一个 <loc> 子标记条目。
创建SiteMap[ ]
如果您有多个网站,可以创建一个或多个 Sitemap 将所有经过验证网站的网址包含在其中,然后将这些 Sitemap 保存在一个位置,以此来简化 Sitemap 的创建和提交过程。您可以通过以下多种方式创建 Sitemap:
根据Sitemap协议创建Sitemap[ ]
- 创建一个文本文件并将其带 .xml 扩展名保存。
- 将以下内容添加到文件顶部:<?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
- 将以下内容添加到文件底部: </urlset>
- 为各网址创建一个条目。 <loc> 为必需,其余标记为可选。
<url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url>
将Sitemap上传到您的网站,然后使用网站管理员工具将其提交给 Google。
Sitemap生成器[ ]
如果您可以访问网络服务器并且服务器装有 Python,则可以利用我们的脚本来创建采用 Sitemap 协议的 Sitemap。 Google Sitemap 生成器(后面的章节介绍)是一个 Python 脚本,可以使用 Sitemap 协议为您的网站创建 Sitemap。 此脚本可以通过网址列表、网络服务器目录或通过访问日志创建 Sitemap。 要使用此脚本:
- 您需要连接到您的网络服务器,并在上面运行脚本。
- 您的网络服务器需安装 Python 2.2 或更高版本。
- 您需要知道启动 Python 的命令。 (该命令通常为 python,但可能会因安装不同而异。) 例如,如果网络服务器安装了两种版本的 Python,命令 python 可调用较早的版本,而命令 python2 则可调用较晚的版本。
- 您需要知道指向贵网站的目录路径。 如果您的网络服务器托管一个网站,则路径可能是 var/www/html 等。 如果您拥有一个托管多个网站的虚拟服务器,路径可能是 home/virtual/site1/fst/var/www/html 等。
- 您需要能够将文件上传到自己的网络服务器(例如,使用 FTP)。
- 如果您要根据访问日志生成一个网址列表,则需要了解用于这些日志的编码,以及指向它们的完整路径。
Sitemap 生成器可以用于生成常规 XML Sitemap。 不过,一些特殊种类的 Sitemap(如代码搜索和视频 Sitemap) 有非常独特的要求。 因此,您最好不要使用 Sitemap 生成器来创建这些 Sitemap。 使用第三方工具:很多第三方提供了可用于创建有效的 Sitemap 的工具。
验证您的Sitemap[ ]
Google 使用 XML 架构定义可以出现在 Sitemaps 文件中的元素和属性。您可从以下链接下载此架构:
- 对于 Sitemaps: http://www.google.com/schemas/sitemap/0.84/sitemap.xsd
- 对于 Sitemaps 索引文件:http://www.google.com/schemas/sitemap/0.84/siteindex.xsd
有多种工具可帮助您根据此架构来验证您的 Sitemaps 结构。在下面的每一个位置您都可以找到 XML 相关的工具列表:
- http://www.w3.org/XML/Schema#Tools
- http://www.xml.com/pub/a/2000/12/13/schematools.html
为了根据某个架构验证您的 Sitemaps 或 Sitemaps 索引文件,XML 文件需要有附加的标头。如果您使用的是 Sitemaps 生成器,这些标头已经包含其中。如果您使用不同的工具创建 Sitemaps,XML 文件中的标头应如下例所示。
Sitemaps:
<?xml version='1.0' encoding='UTF-8'?> <urlset xmlns="http://www.google.com/schemas/sitemap/0.84" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84 http://www.google.com/schemas/sitemap/0.84/sitemap.xsd"> <url> ... </url> </urlset>
Sitemaps 索引文件:
<?xml version='1.0' encoding='UTF-8'?> <sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84 http://www.google.com/schemas/sitemap/0.84/siteindex.xsd"> <sitemap> ... </sitemap> </sitemapindex>
提交SiteMap[ ]
SiteMap制作完成以后直接传到空间上(只要传到网络上,能访问就行),然后在各个搜索网站提交。
- 向Google提交网站地图Sitemap: 通过http://www.google.com/webmasters管理提交;
- 向Yahoo!提交网站地图Sitemap: 通过http://siteexplorer.search.yahoo.com管理提交;
- 向百度Baidu提交网站地图Sitemap: 没办法,现在百度不支持Sitemap。但可通过http://www.baidu.com/search/url_submit.html来提交你的网址。百度自行搜索,更新速度很快。