当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 搜索引擎喜欢UTF-8编码robots.txt

网站优化
站长小参考:网站备案操作流程
韩国网站之网站颜色组合搭配
国际网页Web设计流程
直袭Web2.0 雅虎新主页功能体验
网页浏览速度提高切实可行的七个方法
网站设计的思考网页版面布局的原理
电脑报参与发起 Comsenz启动大型网络社区调查
古有伯乐金睛识千里马 今有网友慧眼荐网站
网络社区调查本月启动 多位专家参与问卷研讨
揭示论坛发展之路 第二届互联网社区调查即将开始
不上你的网站的50个原因
首页所应该达到的几个目标
网站投资你和我的20个自身检查
Alexa 工具条下载
做网站后台的流程
轻轻松松做站长系列视频教程
alexa 攻略技术大全
破坏用户体验 网站十种做法讨人厌
谈用户体验,别落下商业利益
网站最令人抓狂的几个用户体验

网站优化 中的 搜索引擎喜欢UTF-8编码robots.txt


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-26   浏览: 79 ::
收藏到网摘: n/a

Google Groups成员指出包括Google在内的大部分常用搜索引擎更宠爱UTF-8编码的robots.txt文件。

相关文章:有道关于robots.txt的解释

Robots.txt这个文件相信大家都不模式吧,是搜索引擎中访问网站的时候要查看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。

当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

语法:最简单的 robots.txt 文件使用两条规则:

• User-Agent: 适用下列规则的漫游器
• Disallow: 要拦截的网页

Robots.txt是一种存放于网站根目录下的ASCII编码的文本文件,Robots.txt的文件名应统一为小写,即robots.txt。

Robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。注意Robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有和没有斜杠“/”这两种表示是不同的URL,也不能用”Disallow: .gif”这样的通配符。

因为robots.txt是一个纯文本文件,所以很多站长在设置网站的这个文件时,随便把系统中过的文本编辑器拿来就写了,然后上传到自己的网站根目录,以为这样就万事大吉了,其实,你只做了一半因为你的马虎。

已经被无数站长证实的事实是:搜索引擎更喜欢UTF-8编码的robots.txt文件。Google Groups成员Phil Payne也是为此做出声明说:在常用的HTML文件编码类型中,Google和其他的搜索引擎都更偏爱UTF-8编码的robots.txt文件。甚至有的文件编码形式都已经被Google直接忽略掉了。

所以请问,你网站根目录下的robots.txt文件是UTF-8编码吗?如果不是,建议你修改为该编码。