当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 搜索引擎真的遵守robots.txt协议吗?

网站优化
交换友情链接注意事项 不要尽相信网站PR
浅谈影响外部链接权重的十大因素
让SEO更大的作用
从关键词火车票 来看各大网站的SEO优化
SEO学习笔记:搜索引擎对作弊的判断条件
十大搜索引擎优化作弊方法
从用户的角度 来看看网站的搜索引擎优化
网站关键词优化研究 当关键词遇到了访客
Google沙盒逃生法
搜索引擎对作弊的判断条件
五个途径写一篇符合网站优化的文章
一句话式问答 网站优化常见问题整理(四)
眼睛视点的搜索引擎优化 浏览视觉与F形状
写好和维持准确元标记 让谷歌顺利找到你
增加高质量外部链接 提升谷歌对网站收录
把搜索优化做在建站之前 网建与优化结合
SEO八小时之外 透过技术来看SEO的学习
一句话式知识 网站吸引链接的三十招技巧
问答式了解创建google Sitemaps的注意事项
和蜘蛛搞好关系 三招让网站收录量大提升

网站优化 中的 搜索引擎真的遵守robots.txt协议吗?


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 45 ::
收藏到网摘: n/a

 我们都知道robots.txt文件是搜索引擎遵守的一个抓取协议,但是是不是真的有效果呢?

搜索引擎真的会遵循这个协议吗?

让我们首先来看看

下面这段 [这是我南昌SEO站点的robots.txt设置:允许GG 百度、ALEXA 抓取,屏蔽了其他一切引擎禁止!]

User-agent:Googlebot

Disallow:

User-agent:baiduspider

Disallow:

User-agent:ia_archiver

Disallow:

User-agent:*

Disallow:/

从理论上来说 这样的设置就屏蔽了其他一切引擎,但实际上这种方法并不能完全屏蔽SOSO YAHOO MSN之类的爬虫,在YAHOO上输入site:www.seo-jx.cn还是可以看到内容以及索引的!
遵守robots协议与否当然是由他们自己说了算的!所以要想完全屏蔽搜索引擎的爬虫,需要在.htaccess中加入限制语句才行,这里我们介绍2种最简单的方法:
1:

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^MSNBOT [NC]
RewriteRule .* - [F]

 

2:

SetEnvIfNoCase User-Agent "^MSNBOT" bad_bot

<Limit GET POST>
Order Allow,Deny
Allow from all
Deny from env=bad_bot
</Limit>

注:MSNBOT 为MSN蜘蛛机器人代码 ,如果想要真正屏蔽某个搜索引擎 把其中的红色部分[MSNBOT]
换成你想要屏蔽的蜘蛛机器人代码即可!
请不要随意添写 否则造成损失与本人无关!
SEO小林发布,转载请注明出处:江西南昌SEO http://www.seo-jx.cn/