咿思舞论坛〖软件技术〗『网站资源』 → 如何创建Sitemap文件

自定义搜索

  共有237人关注过本帖树形打印

主题:如何创建Sitemap文件

美女呀,离线,留言给我吧!
admin
  1楼 个性首页 | 博客 | QQ | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:管理员 帖子:853 积分:1008523 威望:1000000 精华:12 注册:2003/12/30 16:34:32
如何创建Sitemap文件  发帖心情 Post By:2011/8/17 14:35:52

什么是sitemap,从wiki上可以找到的解释是:(通俗的讲就是“网站地图”)。
        即Sitmap是站点管理员向搜索引擎爬虫公布站点可被抓取页面的协议,Sitemap文件内容必须遵循XML格式的定义。每个URL可以包含更新的周期和时间、URL在整个站点中的优先级。这样可以让搜索引擎更佳有效的抓取网站内容。
       
    Sitemap分为2种形式:
        1、Sitemap.html :            这种主要是针对用户而言,让用户能够快速的寻找到自己所需的东西,也是方便搜索引擎来有效的爬取网页内容,提高网站质量。
        2、Sitemap.xml  :            这种格式主要是谷歌自己推出的一种网站地图写法,你可以通过相关规范写出网站地图 然后通过“谷歌管理员工具”提交,这样谷歌的蜘蛛就能有目的的高效的快速的来访问网站,但是 提交的内容 谷歌蜘蛛没有保证一定都会收录!这个误区 请大家要区分开来。
   
    Sitemaps 的XML格式样例:
       <?xml version="1.0" encoding="UTF-8" ?>
       <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
                xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
                http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
         <url>
         <loc>http://www.145829.com/</loc>
         <lastmod>2011-08-08</lastmod>
         <changefreq>daily</changefreq>
         <priority>1.0</priority>
         </url>
    </urlset>
    目前Google、Yahoo和Ask.com支持的最新Sitemap标准是0.9版本。Sitemap文件必须为utf-8的编码格式,每个Sitemap文件只能有一个<urlset>的顶级标签。
   每个<url>标签是对一个URL的描述:
    <loc>(必填)该页的网址。如果您的网络服务器需要网址的话,此网址应以协议开始(例如:http)并以斜杠结尾。该值必须少于 2,048 个字符。
    <lastmod>(可选)该文件上次修改的日期。此日期应采用 W3C Datetime 格式。如果需要,此格式允许省略时间部分,并使用 YYYY-MM-DD。
    <changefreq>(可选)页面可能发生更改的频率。此值为搜索引擎提供一般性信息,可能与搜索引擎抓取页面的频率不完全相关。有效值为:always,hourly,daily,weekly,mothly,yearly,never。“always”值应当用于描述随每次访问而改变的文档。而“never”值则应当用于描述存档的网址。请注意,抓取工具会将此标记的值视为提示而不是命令。尽管搜索引擎抓取工具在做决定时会考虑此信息,但对于标记为“hourly”页面的抓取频率可能低于每小时一次,而对于标记为“yearly”页面的抓取频率可能高于每年一次。抓取工具也可能会定期抓取标记为“never”的网页,以便能够处理对这些网页的未预期更改。
    <priority>此网址的优先级是相对于您网站上其他网址的优先级而言的。有效值范围从 0.0 到 1.0。该值不会影响您的网页与其他网站上网页的比较结果,而只是告知搜索引擎您认为哪些网页对抓取工具来说最为重要。一个网页的默认优先级为 0.5。请注意,为网页指定的优先级并不会影响网址在搜索引擎结果页上的排名。搜索引擎在同一网站上选择不同网址时会使用此信息,因此,您可以使用此标记增加最重要的网页在搜索索引中显示的可能性。另请注意,为网站中的所有网址都指定高优先级并不会带来什么好处。因为优先级是相对的,只用于在您网站的网址之间进行选择。
    Sitemap文件的限制:
         必须是utf-8的编码格式
         每个Sitemap.xml文件包含的URL建议不超过5万个URL
         单个Sitemap.xml文件不能超过10M大小
   
    在线的Sitemap生成工具:
        www.xml-sitemaps.com,它支持创建XML, ROR, Text, HTML等格式的Sitemap文件。
       
    Sitemap文件验证:
        www.validome.org/google/validate,它可以帮你检查Sitemap文件是否有错误
 

根据 Sitemap 协议创建 Sitemap:

  1. 创建一个文本文件并将其带 .xml 扩展名保存。
  2. 将以下内容添加到文件顶部:
     <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  3. 将以下内容添加到文件底部:
      </urlset>
  4. 为各网址创建一个条目。 <loc> 为必需,其余标记为可选。
    <url>
        <loc>http://www.145829.com/</loc>
        <lastmod>2011-08-08</lastmod>
        <changefreq>monthly</changefreq>
        <priority>0.8</priority>
    </url> 
  5. 将 Sitemap 上传到您的网站。 然后使用网站管理员工具将其提交给 Google。

 


 

[此贴子已经被作者于2011-08-17 14:42:00编辑过]

支持(0中立(0反对(0单帖管理 | 引用 | 回复 回到顶部

返回版面帖子列表

如何创建Sitemap文件








签名