当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 有道关于robots.txt的解释

网站优化
网络推广经验谈 浅谈交换友情链接中存在的若干陷阱
网页优化中Meta Keywords已经没有必要了!
SEO案例分析 alimama做SEO引流量的方法
百度快照 不更新的原因分析
友情链接不要太在意对方PR值
打造IP流量上万的五个网站推广技巧
正确的学习搜索引擎优化SEO
网站被搜索引擎惩罚主要的原因分析
黑帽 SEO到底有没有用
SEO与用户体验的关系
友情链接页与频道目录页的链接区别分析
针对搜索做网站用二级域名还是用一级目录?
搜索引擎最近的变化说明
SEO 大流量网站思路
SEO理论知识分享 SEO思想的转变
SEO教程 使网页代码尽量符合WEB标准
SEO入门技巧 学好SEO
做好百度优化的几个因素
Seo nofollow和Web标准化
SEO Globalsources应用锚文本和关键字

网站优化 中的 有道关于robots.txt的解释


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-26   浏览: 52 ::
收藏到网摘: n/a

怎么写robots.txt文件?
robots.txt是个很简单的文本文件,您只要标明“谁不能访问哪些链接”即可。
在文件的第一行写:
User-Agent: YodaoBot
这就告诉了爬虫下面的描述是针对名叫YodaoBot的爬虫。您还可以写:
User-Agent: *
这就意味着向所有的爬虫开放。需要注意的是一个robots.txt文件里只能有一个"User-Agent: *"。

接下来是不希望被访问的链接前缀。例如:
Disallow: /private
这就告诉爬虫不要抓取以"/private"开头的所有链接。包括/private.html,/private/some.html,/private/some/haha.html。如果您写成:
Disallow: /
则表明整个站点都不希望被访问。您也可以分多行来指定不希望被抓取的链接前缀,例如:
Disallow: /tmp
Disallow: /disallow
那么所有以"/tmp"和"/disallow"开头的链接都不会被访问了。

最后形成的robots.txt文件如下:
User-Agent: YodaoBot
Disallow: /tmp
Disallow: /private

请注意,如果您的robots.txt文件里有中文等非英语字符,请确定该文件是由UTF-8编码编写。