当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 有道关于robots.txt的解释

网站优化
一个seoer给网站设计者的几点建议
针对Z-Blog博客程序 常用博客SEO优化技巧
垃圾网站在一年时间内 pr值从0到6的秘密
网站优化 关键词及主题的优化你做好了吗
浅谈SEO优化连接的几种类型
SEO内链常见形式 做好站内链接四点建议
QQ类网站经验 SEO稳扎稳打才能步步为营
流传很久的一份资料 SEO中HTML标签权重
搜索引擎最不喜欢哪些网站 预防九种情况
对一家FLASH网站进行SEO优化的心得经验
研究是SEO优化最快的成长之路 实践中成长
SEO速成之路 研究
用博客建设外部链接要点
被百度K掉,应提前预防
多种营销方式为SEO所用 思考与技术之别
谷歌中文网站管理员解答释疑重复内容问题
搜索引擎不喜欢的九大因素
多次被搜索引擎惩罚 逐渐发现一些优化忌讳
搜索引擎优化重点之网站内外链接策略
不懂seo也可以做seo的简单方法总汇

网站优化 中的 有道关于robots.txt的解释


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-26   浏览: 98 ::
收藏到网摘: n/a

怎么写robots.txt文件?
robots.txt是个很简单的文本文件,您只要标明“谁不能访问哪些链接”即可。
在文件的第一行写:
User-Agent: YodaoBot
这就告诉了爬虫下面的描述是针对名叫YodaoBot的爬虫。您还可以写:
User-Agent: *
这就意味着向所有的爬虫开放。需要注意的是一个robots.txt文件里只能有一个"User-Agent: *"。

接下来是不希望被访问的链接前缀。例如:
Disallow: /private
这就告诉爬虫不要抓取以"/private"开头的所有链接。包括/private.html,/private/some.html,/private/some/haha.html。如果您写成:
Disallow: /
则表明整个站点都不希望被访问。您也可以分多行来指定不希望被抓取的链接前缀,例如:
Disallow: /tmp
Disallow: /disallow
那么所有以"/tmp"和"/disallow"开头的链接都不会被访问了。

最后形成的robots.txt文件如下:
User-Agent: YodaoBot
Disallow: /tmp
Disallow: /private

请注意,如果您的robots.txt文件里有中文等非英语字符,请确定该文件是由UTF-8编码编写。