当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 访问日志 寻找百度蜘蛛的足迹

网站优化
SEO 网站反向链接的4个原则
SEO 网站内部重复内容的处理步骤
Google蜘蛛爬虫可以运行网页中的JS脚本和CSS样式
代码语义化是最好的SEO
网站被K的原因分析
Google排名 网页加载速度和SEO的关系
SEO 探讨的百度link和谷歌PR
SEO是网站建设和发展策略的组成部分
网站优化教程:网站首页优化的注意事项
2010年SEO行业的挑战与困难
Google优化:HTML静态页面要比伪静态好
SEO指导知识:探讨的百度link和谷歌PR
Google排名:网页加载速度和SEO的关系
Google:推广自己的网站无需群发垃圾链接
SEO基础入门:搜索引擎的常用指令
Web Developer工具栏简化诊断SEO问题
典型的过度优化的网站特征
SEO教程:如何选择关键词,如何维护关键词
复制内容产生重复搜索引擎如何处理重复内容
适当的用群发软件群发链接也可以提升PR值

网站优化 中的 访问日志 寻找百度蜘蛛的足迹


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 31 ::
收藏到网摘: n/a

像很多开始学SEO的新手一样,SEO地爱歪也对这个问题有过迷惑,认为百度、Google等的蜘蛛都是晚上爬行这也是很多SEO高手或大师们的说法。所以造成了大多数SEO们的认识。

可是就在前几天,SEO地爱歪也想真正寻求这个问题的答案。而方法就是分析WEB服务器的访问日志。今天我就下载网站的日志,并带领大家一起寻找百度SPIDER的踪迹。我用的万网的UNIX服务器,可能有的朋友跟我的不同,不过大同小异。

1、我们FTP到网站目录

2、打开wwwlogs目录,如果根目录下没用该目录,请询问服务商的技术支持,反正这一步找到日志文件的存放路径

3、查看日志文件,一般来讲,访问日志会按照日期进行存储,比如SEO地爱歪的就是access.log.2.gz

4、我们拖放该文件到本地

5、解压,然后用写字板打开,一般用记事本打开会显示得很乱

6、查询baiduspider

7、在结果中查看百度蜘蛛的爬行痕迹,如图所示:

8/我们继续寻找百度蜘蛛的踪迹,下面是百度蜘蛛晚上3点

61.135.168.39 - - [23/Jun/2008:03:06:59 +0800] “GET / HTTP/1.1” 200 6248 “-” “Baiduspider+(+

9、下图是我们本文的重点,

61.135.168.35 - - [23/Jun/2008:10:39:52 +0800] ”GET / HTTP/1.1“ 200 6248 ”-“ ”Baiduspider+(+

我们可以很明白的看到百度蜘蛛上午10点仍然在爬行我的站点。

10、我们继续寻找,可以看到11点12点13点、14点的爬行踪迹。

总之,百度蜘蛛爬行不一定只有晚上,可能白天也很多,换点石的一位会员的说法是:

蜘蛛一般很早就来吃早餐如果你的网站很美味,中午和下午都会再回来。 原文:www.zph5.com