当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 搜索引擎真的遵守robots.txt协议吗?

网站优化
主流论坛程序相同的搜索引擎优化注意要点
Web标准有利于搜索引擎优化?
把访问者留在网站的核心 SEO观念要正确
做好网站链接建设 做好自然链接人工链接
比较快速地提高网站PR值的十个有效办法
百度图片搜索优化技巧 让网站流量再翻番
对症下药 如何让自己网站不被百度潜规则
搜索引擎如何来评估网站链接的
优化热门关键字的5点心得体会
提高文章搜索引擎优化质量的十八个小技巧
谷歌官方《搜索引擎优化指南》网站内容篇
谷歌官方《搜索引擎优化指南》链接文本篇
谷歌官方《搜索引擎优化指南》标题标签篇
谷歌官方《搜索引擎优化指南》网页图片篇
SEO关键字排名VS用户体验谁更重要?
网站优化的几个要点
影响网页在谷歌搜索引擎上权重的三个因素
针对谷歌搜索引擎 选取关键词的十个技巧
从搜索引擎优化角度 分析月光博客的成功
快速获取百度排名之偷梁换柱与抛砖引玉篇

网站优化 中的 搜索引擎真的遵守robots.txt协议吗?


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 83 ::
收藏到网摘: n/a

 我们都知道robots.txt文件是搜索引擎遵守的一个抓取协议,但是是不是真的有效果呢?

搜索引擎真的会遵循这个协议吗?

让我们首先来看看

下面这段 [这是我南昌SEO站点的robots.txt设置:允许GG 百度、ALEXA 抓取,屏蔽了其他一切引擎禁止!]

User-agent:Googlebot

Disallow:

User-agent:baiduspider

Disallow:

User-agent:ia_archiver

Disallow:

User-agent:*

Disallow:/

从理论上来说 这样的设置就屏蔽了其他一切引擎,但实际上这种方法并不能完全屏蔽SOSO YAHOO MSN之类的爬虫,在YAHOO上输入site:www.seo-jx.cn还是可以看到内容以及索引的!
遵守robots协议与否当然是由他们自己说了算的!所以要想完全屏蔽搜索引擎的爬虫,需要在.htaccess中加入限制语句才行,这里我们介绍2种最简单的方法:
1:

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^MSNBOT [NC]
RewriteRule .* - [F]

 

2:

SetEnvIfNoCase User-Agent "^MSNBOT" bad_bot

<Limit GET POST>
Order Allow,Deny
Allow from all
Deny from env=bad_bot
</Limit>

注:MSNBOT 为MSN蜘蛛机器人代码 ,如果想要真正屏蔽某个搜索引擎 把其中的红色部分[MSNBOT]
换成你想要屏蔽的蜘蛛机器人代码即可!
请不要随意添写 否则造成损失与本人无关!
SEO小林发布,转载请注明出处:江西南昌SEO http://www.seo-jx.cn/