当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 搜索引擎真的遵守robots.txt协议吗?

网站优化
三大搜索引擎联手推出新标准应对复制网页
优化实战:对FLASH型网站进行优化的心得
流量分析:决定SEO效果的四大主要原因
703公交车上的SEO启发
提高网站质量 分析四种网站交换链接对象
2008年RSS订阅最多的30个顶尖SEO博客
他上之石可以取玉 分享大型网站SEO策略
从用户体验和SEO两个角度谈谈网站的描述
SEO单个网页的最优化操作
获取关键词大流量 做好SEO方法中五大要点
简简单单就十个方面 做好WordPress的SEO
警惕 六种情况导致网站难以被搜索引擎收录
导致网站的搜索引擎优化失败的七个大方面
完善三个方面让谷歌对网站的索引变得更快
关键词选择攻略 处理好冷热门及专业关系
案例分析 通过新浪女性页面看关键词堆砌
与网站有些不同 博客流量来源的10个途径
又一强悍外链平台搜狐博客回归搜索
网站进行优化后也许并不需要进行静态处理
网址规范化最新解决方法 3大搜索引擎支持

网站优化 中的 搜索引擎真的遵守robots.txt协议吗?


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 109 ::
收藏到网摘: n/a

 我们都知道robots.txt文件是搜索引擎遵守的一个抓取协议,但是是不是真的有效果呢?

搜索引擎真的会遵循这个协议吗?

让我们首先来看看

下面这段 [这是我南昌SEO站点的robots.txt设置:允许GG 百度、ALEXA 抓取,屏蔽了其他一切引擎禁止!]

User-agent:Googlebot

Disallow:

User-agent:baiduspider

Disallow:

User-agent:ia_archiver

Disallow:

User-agent:*

Disallow:/

从理论上来说 这样的设置就屏蔽了其他一切引擎,但实际上这种方法并不能完全屏蔽SOSO YAHOO MSN之类的爬虫,在YAHOO上输入site:www.seo-jx.cn还是可以看到内容以及索引的!
遵守robots协议与否当然是由他们自己说了算的!所以要想完全屏蔽搜索引擎的爬虫,需要在.htaccess中加入限制语句才行,这里我们介绍2种最简单的方法:
1:

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^MSNBOT [NC]
RewriteRule .* - [F]

 

2:

SetEnvIfNoCase User-Agent "^MSNBOT" bad_bot

<Limit GET POST>
Order Allow,Deny
Allow from all
Deny from env=bad_bot
</Limit>

注:MSNBOT 为MSN蜘蛛机器人代码 ,如果想要真正屏蔽某个搜索引擎 把其中的红色部分[MSNBOT]
换成你想要屏蔽的蜘蛛机器人代码即可!
请不要随意添写 否则造成损失与本人无关!
SEO小林发布,转载请注明出处:江西南昌SEO http://www.seo-jx.cn/