当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 搜索引擎喜欢UTF-8编码robots.txt

网站优化
SEO的步骤参考
SEO 两大搜索引擎网站近期算法分析
SEO 搜索引擎算法探讨
SEO 选择合适的CMS建站
SEO Google如何处理低质量链接
SEO 网站管理员工具深入分析
SEO 分析某关键词的竞争强度
B2C 电子商务网站如何做推广和优化
网页游戏的推广的策略与效果分析
网站排名下降的主要原因分析
网站关键词排名发生变化时的应对方法
Google为网站提供相关链接功能
正确解决IE6的问题的方法
谈google 命名锚链接识别网页段落
动易CMS的目录结构SEO优化
让你的wordpress博客备受搜索引擎青睐
经过实践后觉得确实有效的Baidu优化经验
网站主要关键词排名不高的原因分析
seo优化通用方式小结
网站推广3种方法操作流程详解

网站优化 中的 搜索引擎喜欢UTF-8编码robots.txt


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-26   浏览: 46 ::
收藏到网摘: n/a

Google Groups成员指出包括Google在内的大部分常用搜索引擎更宠爱UTF-8编码的robots.txt文件。

相关文章:有道关于robots.txt的解释

Robots.txt这个文件相信大家都不模式吧,是搜索引擎中访问网站的时候要查看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。

当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

语法:最简单的 robots.txt 文件使用两条规则:

• User-Agent: 适用下列规则的漫游器
• Disallow: 要拦截的网页

Robots.txt是一种存放于网站根目录下的ASCII编码的文本文件,Robots.txt的文件名应统一为小写,即robots.txt。

Robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。注意Robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有和没有斜杠“/”这两种表示是不同的URL,也不能用”Disallow: .gif”这样的通配符。

因为robots.txt是一个纯文本文件,所以很多站长在设置网站的这个文件时,随便把系统中过的文本编辑器拿来就写了,然后上传到自己的网站根目录,以为这样就万事大吉了,其实,你只做了一半因为你的马虎。

已经被无数站长证实的事实是:搜索引擎更喜欢UTF-8编码的robots.txt文件。Google Groups成员Phil Payne也是为此做出声明说:在常用的HTML文件编码类型中,Google和其他的搜索引擎都更偏爱UTF-8编码的robots.txt文件。甚至有的文件编码形式都已经被Google直接忽略掉了。

所以请问,你网站根目录下的robots.txt文件是UTF-8编码吗?如果不是,建议你修改为该编码。