当前位置: 首页 > 图文教程 > 网站运营 > 建站经验 > linux运维实战:K掉口碑,欢迎百度

建站经验
我骄傲我的站 关于我的纹身网站
大学生网上卖菜 为你解决开门七件事
做电子商务 选择好的虚拟主机是关键
惨痛教训站长足戒 给建站初期的各位站长
做网站需要的是坚持和不断学习的精神
网站发帖宣传应该注意哪些地方
新手做论坛,要用好你的每一分钱
草根站长每天需要做的事情 今天你做了吗
从站长力量网的成功看网站功能的创新重要性
设计能力决定权力
坚持、勤思、善学 建站路程从失败走向成功
分类信息网站未来命运!
关于快速提升新站PR值的方法见解
真正学会做网站的时候 你就成了情场高手
网站容易被百度拔毛的几点情况及预防建议
如何让SupeSite7.0首页显示全部的频道分类
我建站被骗经历和一点经验
软文使网站从PR1提升到PR3 谈软文的好处
踏踏实实做站 放弃网赚成富翁的幻想
教训:垃圾服务器差点让我的网站毁于一旦

建站经验 中的 linux运维实战:K掉口碑,欢迎百度


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 58 ::
收藏到网摘: n/a

相信很多有经验的站长和我一样,每天观察流量统计,同样,今天也不例外。

早上上班后就发现今天流量PV(点击量)有点低,但是IP并没低多少,当时也没在意,因为周三流量通常比周二要低一点。

笔者网站使用的是linux环境,晚上的时候就发现网站速度比较慢,因为刚刚把服务器换到电信A类机房,所以速度还是有点信心的。于是使用top命令检查负载,发现负载超过40,一般负载超过10速度就会慢下来,按照往常的经验,who、ps等命令检查链接和进程,接着使用netstat -a -n检查访问请求,发现119.42.245.*有几个IP异常(后面会提到如何判断异常IP),链接IP138检查IP来源,发现是阿里巴巴的(汗一下!阿里的IP段都是写的公司名称)。

笔者网站必够网是老牌的分类信息网站,而阿里旗下的口碑网是国内最大的分类信息站,百度收录量1400万,而赶集、58、百姓、必够网收录都在一千万以内(看来“业精于勤”啊,再汗一把)。

立即,使用iptables -I INPUT -s 119.42.245.0/16 -j DROP 命令封掉IP段,ok,一切搞定,负载逐步降低到5以下。

接下来的时间继续做功课,分析当日流量,删除垃圾信息(很重要,笔者以前曾经写过分类信息站淘汰法则—被垃圾、违法信息淹死?推荐大家看看)以及构思产品的改进策略。

过了一会有检查了一下负载,发现又上升到7了,于是依葫芦画瓢,又一个IP段出现我我视野61.135.249.*,这个IP段有点熟悉,似乎是搜索引擎爬虫,于是每2分钟netstat -a -n一下,COPY到ultraedit编辑器里,取3次记录,然后总结,发现这个IP段出现的次数都在35~40之间(百度爬虫的频率一般是37,不知道有站长研究过没),百度爬虫有61.135开头的爬虫段。

访问下网站,发现速度正常,看来专业爬虫的技术就是好,不会把人弄宕机。

另补充说明下如何判断异常IP:

看IP段 ,一些爬虫会自动换IP,防止被封。所以要看IP段出现的频率。不能确定的话可以隔段时间再看。

看IP地址,一般国外IP我都是直接封IP。

看抓取频率,搜索引擎的爬虫抓取频率会很合适,绝对不会长时间以超过你网站承受能力的频率抓。

OK,祝福各位站长身体事业两不误。