当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 有道关于robots.txt的解释

网站优化
SEO 网站标题title注意的三点内容
SEO 用语义化的HTML制作网页
SEO中HTML标签权重 SEO 搜索引擎优化简明教程
标题标记H和强调标记strong
发垃圾帖子或回复可能会降低网站排名
新站够获得好的百度排名的一些经验小结
新站关键词排名不稳定现象解析
新手SEO很容易犯的错误汇总
SEO 分享增加网站反向链接经验
提高网页关键词搜索引擎排名的5个方法
外部链接优化效果远不如内部链接
网站优化 关于网页地址URL的约定规则
谷歌站长工具关键字分析页面新的调整
SEO 静态网页不一定优于动态网页
应对Google的个性化搜索对SEO的影响
所谓的SEO高手们请不要再自欺欺人了
搜索引擎的收录量不增加的原因分析
让友情链接发挥最佳效果
垃圾链接其隐藏背后的危害
Google 个性化搜索对SEO的影响

网站优化 中的 有道关于robots.txt的解释


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-26   浏览: 51 ::
收藏到网摘: n/a

怎么写robots.txt文件?
robots.txt是个很简单的文本文件,您只要标明“谁不能访问哪些链接”即可。
在文件的第一行写:
User-Agent: YodaoBot
这就告诉了爬虫下面的描述是针对名叫YodaoBot的爬虫。您还可以写:
User-Agent: *
这就意味着向所有的爬虫开放。需要注意的是一个robots.txt文件里只能有一个"User-Agent: *"。

接下来是不希望被访问的链接前缀。例如:
Disallow: /private
这就告诉爬虫不要抓取以"/private"开头的所有链接。包括/private.html,/private/some.html,/private/some/haha.html。如果您写成:
Disallow: /
则表明整个站点都不希望被访问。您也可以分多行来指定不希望被抓取的链接前缀,例如:
Disallow: /tmp
Disallow: /disallow
那么所有以"/tmp"和"/disallow"开头的链接都不会被访问了。

最后形成的robots.txt文件如下:
User-Agent: YodaoBot
Disallow: /tmp
Disallow: /private

请注意,如果您的robots.txt文件里有中文等非英语字符,请确定该文件是由UTF-8编码编写。