当前位置: 首页 > 图文教程 > 网站运营 > 建站经验 > linux运维实战:K掉口碑,欢迎百度

建站经验
2010年个人网店发展方向是什么
谷歌退出中国对中国个人网站产生的影响
IDC运营商整顿造成网页游戏平台损失巨大
雨林木风旗下114啦组宣布建网站联盟
个人网站注重用户黏度逐渐开始依赖第三方统计
免费注册.TK后缀顶级域名的图文教程
Google Analytics实现虚拟浏览量跟踪
MailCounter:显示出文章被转寄的次数
2-5位数字和纯字母域名已经全部注册
探讨影响网站实现转化的10大误区(下)
新手入门:掌握网站域名基础知识
.com域名转出到godaddy的图文操作教程
目前全球支持支付宝付款的3家美国主机商
低效率的备案让草根站长忧心忡忡
电子商务网站不要放置广告联盟的广告
调查分析:网站PR值高低和网站成功的关系
决定网站价值的因素和网站价值评估工具
谷歌购买AdWords关键字解释原因
推荐好玩的给人物脸部变形的网站:Monoface.com
WAP网站,传统web网站和搜索引擎

建站经验 中的 linux运维实战:K掉口碑,欢迎百度


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 60 ::
收藏到网摘: n/a

相信很多有经验的站长和我一样,每天观察流量统计,同样,今天也不例外。

早上上班后就发现今天流量PV(点击量)有点低,但是IP并没低多少,当时也没在意,因为周三流量通常比周二要低一点。

笔者网站使用的是linux环境,晚上的时候就发现网站速度比较慢,因为刚刚把服务器换到电信A类机房,所以速度还是有点信心的。于是使用top命令检查负载,发现负载超过40,一般负载超过10速度就会慢下来,按照往常的经验,who、ps等命令检查链接和进程,接着使用netstat -a -n检查访问请求,发现119.42.245.*有几个IP异常(后面会提到如何判断异常IP),链接IP138检查IP来源,发现是阿里巴巴的(汗一下!阿里的IP段都是写的公司名称)。

笔者网站必够网是老牌的分类信息网站,而阿里旗下的口碑网是国内最大的分类信息站,百度收录量1400万,而赶集、58、百姓、必够网收录都在一千万以内(看来“业精于勤”啊,再汗一把)。

立即,使用iptables -I INPUT -s 119.42.245.0/16 -j DROP 命令封掉IP段,ok,一切搞定,负载逐步降低到5以下。

接下来的时间继续做功课,分析当日流量,删除垃圾信息(很重要,笔者以前曾经写过分类信息站淘汰法则—被垃圾、违法信息淹死?推荐大家看看)以及构思产品的改进策略。

过了一会有检查了一下负载,发现又上升到7了,于是依葫芦画瓢,又一个IP段出现我我视野61.135.249.*,这个IP段有点熟悉,似乎是搜索引擎爬虫,于是每2分钟netstat -a -n一下,COPY到ultraedit编辑器里,取3次记录,然后总结,发现这个IP段出现的次数都在35~40之间(百度爬虫的频率一般是37,不知道有站长研究过没),百度爬虫有61.135开头的爬虫段。

访问下网站,发现速度正常,看来专业爬虫的技术就是好,不会把人弄宕机。

另补充说明下如何判断异常IP:

看IP段 ,一些爬虫会自动换IP,防止被封。所以要看IP段出现的频率。不能确定的话可以隔段时间再看。

看IP地址,一般国外IP我都是直接封IP。

看抓取频率,搜索引擎的爬虫抓取频率会很合适,绝对不会长时间以超过你网站承受能力的频率抓。

OK,祝福各位站长身体事业两不误。