当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 深度分析 谷歌搜索引擎蜘蛛等级那些事儿

网站优化
主流论坛程序相同的搜索引擎优化注意要点
Web标准有利于搜索引擎优化?
把访问者留在网站的核心 SEO观念要正确
做好网站链接建设 做好自然链接人工链接
比较快速地提高网站PR值的十个有效办法
百度图片搜索优化技巧 让网站流量再翻番
对症下药 如何让自己网站不被百度潜规则
搜索引擎如何来评估网站链接的
优化热门关键字的5点心得体会
提高文章搜索引擎优化质量的十八个小技巧
谷歌官方《搜索引擎优化指南》网站内容篇
谷歌官方《搜索引擎优化指南》链接文本篇
谷歌官方《搜索引擎优化指南》标题标签篇
谷歌官方《搜索引擎优化指南》网页图片篇
SEO关键字排名VS用户体验谁更重要?
网站优化的几个要点
影响网页在谷歌搜索引擎上权重的三个因素
针对谷歌搜索引擎 选取关键词的十个技巧
从搜索引擎优化角度 分析月光博客的成功
快速获取百度排名之偷梁换柱与抛砖引玉篇

网站优化 中的 深度分析 谷歌搜索引擎蜘蛛等级那些事儿


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 52 ::
收藏到网摘: n/a

一、GOOGLE搜索引擎蜘蛛的等级

首先先谈下GOOGLE蜘蛛起源。

当GOOGLE搜索引擎刚建立之初,就拥有这一个非常强大的的服务器,其每天放出大量的蜘蛛,我们称为1号蜘蛛,其抓取量抓取速度是非常的快,对其整个互联网每天进行信息进行的采集,可见服务器的速度是多少快,其实最主要的是后期GOOGLE将服务器延伸到了很多城市,所以现在你能发现GOOGLE的运算速率是超前的快。

服务器将采集的信息分类,整理到庞大的数据库。其中有个数据库都是用来存网站域名的。域名只要被搜索引擎索引到,将自动存入此数据库。此数据库是1号蜘蛛的核心。

其内部分为10个PR各等级的小数据库,虽说小数据库,但也是大的可怕。10个等级的数据库 其周期也不同,基本上以一个PR=4的网站来讲 1号蜘蛛爬行的概率也在7天一次。所以基本你也会发现收录有大的幅度也是在7天内的某一天 。

细心的站长会发现其实有时候7天还是蛮准的,但只针对PR=4。越是PR高其周期越是短,越是PR低周期越长,当然说到这很多站长有这样的疑惑。会觉得蜘蛛有时天天收录他的站这里对其收录的也就是接下来要说的2号蜘蛛,2号蜘蛛往往是在1号蜘蛛爬行过程中放出去的,主要针对于被1号蜘蛛爬过的网站的外部链接。PS既然都说是2号蜘蛛 肯定其抓取力度要比1号小很多。

二、当然不只是有2号,还有3号蜘蛛

所谓3号也就 A站1号蜘蛛爬行到B站,B站的2号蜘蛛爬行到C站。

目前GOOGLE为了限制其无限的循环对于蜘蛛只分为这三个等级。并对其等级的抓取率有个很明确的标准,而且2号与3号蜘蛛有个抓取特点 基本以时间的先后顺序进行抓取。

三、 比方讲

A网站被1号蜘蛛爬行后的一篇文章最后时间为 2008-12-12,那当A网站被从别的网站过来的2号蜘蛛给爬行,首先有可能会对其收录的是,最近发表的几篇文章如: 2008-5-31等 2008-5-30等文章将会进行第2次,第3次的访问,之后再爬行2008-12-12以后的信息。如果你网站没有任何更新,它将对其近一个月内的更改内容进行2次爬行。

如果外部来的2号与3号蜘蛛越多,同一篇文章有可能会被爬上好几次。

以下为GOOGLE提供的官方数据。

四、1号蜘蛛

基本抓取率在5%~10%

基于PR=0 没有任何导入链接与提交时 有可能被抓取的周期在6个月~12个月不等

基于PR=1 没有任何导入链接与提交时 有可能每次被抓取的周期在4个月~8个月不等

基于PR=2 没有任何导入链接与提交时 有可能被抓取的周期在2个月~4个月不等

基于PR=3 没有任何导入链接与提交时 有可能被抓取的周期在1个月~2个月不等

基于PR=4 没有任何导入链接与提交时 有可能被抓区的周期在1周~1个月不等

当然没有任何导入链接的网站无法做到PR=4

最高也只有PR=3

上述此数据只是GOOGLE官方提供的一个基数。意思也就是1号蜘蛛主动爬取你网站的周期数。对于2号或者3号蛛爬取你的网站,也就根据你的导入链接而定。所以你会发现你的网站有时天天在被更新。

五、2号蜘蛛

基本抓取率是2。5%~5%<基于1号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问。

六、3号蜘蛛

基本抓取率为1。25%~2。5%<基于1号蜘蛛与2号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问。

GOOGLE目前蜘蛛的等级分为三种,当然蜘蛛有不同的蜘蛛,这里单单只的是网页蜘蛛,因为我只对这个感兴趣。