当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 有道关于robots.txt的解释

网站优化
flash对seo的影响分析
更新网站百度快照的方法 关键词与外链
可以增加关键字密度几种好方法
导致网站被百度降权的常见因素分析
SEO 策略 搜索引擎 排名
Flash 网站优化有窍门
SEO 优化需要兼顾用户体验设计
不容忽视的SEO优化细节
SEO第一名 只能是谎言
个人站长推广经验与技巧小结
百度快照 频频停止 几种原因分析
微软Bing搜索引擎 网站提交
Bing 网站管理员工具使用指南
国外 SEO优化 几个知识
Web 图片优化技巧总结
SEO 初学者必读
写软文离不开文字功底和素材的说明
SEO 初学者需要掌握的几个基本技能
Google 网页质量 评估 分析
百度对于新站平稳收录的一些技巧分享

网站优化 中的 有道关于robots.txt的解释


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-26   浏览: 42 ::
收藏到网摘: n/a

怎么写robots.txt文件?
robots.txt是个很简单的文本文件,您只要标明“谁不能访问哪些链接”即可。
在文件的第一行写:
User-Agent: YodaoBot
这就告诉了爬虫下面的描述是针对名叫YodaoBot的爬虫。您还可以写:
User-Agent: *
这就意味着向所有的爬虫开放。需要注意的是一个robots.txt文件里只能有一个"User-Agent: *"。

接下来是不希望被访问的链接前缀。例如:
Disallow: /private
这就告诉爬虫不要抓取以"/private"开头的所有链接。包括/private.html,/private/some.html,/private/some/haha.html。如果您写成:
Disallow: /
则表明整个站点都不希望被访问。您也可以分多行来指定不希望被抓取的链接前缀,例如:
Disallow: /tmp
Disallow: /disallow
那么所有以"/tmp"和"/disallow"开头的链接都不会被访问了。

最后形成的robots.txt文件如下:
User-Agent: YodaoBot
Disallow: /tmp
Disallow: /private

请注意,如果您的robots.txt文件里有中文等非英语字符,请确定该文件是由UTF-8编码编写。