当前位置: 首页 > 图文教程 > 网站运营 > 建站经验 > linux运维实战:K掉口碑,欢迎百度

建站经验
90后站长:建站50天,让我学到的
80后的站长路 从无知到熟悉
产品设计好坏的三个衡量标准
中国货仓网:网店日过百张订单的经验分享
网站建设为什么如此便宜 企业建站续警惕
高山:写软文的境界
新站我是如何获得原创文章的
推广是"鸡肋",内容才是"硬道理"
2年做站坎坷心情五味杂陈
门雨:做地方站点从论坛社区开始
网站上线前对于标准化建站的思想
[原创]在 Lighttpd 中配置 ShopEx 4.8.x 伪静态
网络的商业化,利于谁家?亏于谁家?
浅论做二手社区网的一点心得
地方性论坛运营之百度收录问题
卢松松:浅谈四大门户网站的评论网页设计
轻松获得alexa新版5星级评价
从国情和国人性格解密为何中国没有DIGG
从用户体验度来提高电子商城销量
论坛前期搭建思路

建站经验 中的 linux运维实战:K掉口碑,欢迎百度


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 40 ::
收藏到网摘: n/a

相信很多有经验的站长和我一样,每天观察流量统计,同样,今天也不例外。

早上上班后就发现今天流量PV(点击量)有点低,但是IP并没低多少,当时也没在意,因为周三流量通常比周二要低一点。

笔者网站使用的是linux环境,晚上的时候就发现网站速度比较慢,因为刚刚把服务器换到电信A类机房,所以速度还是有点信心的。于是使用top命令检查负载,发现负载超过40,一般负载超过10速度就会慢下来,按照往常的经验,who、ps等命令检查链接和进程,接着使用netstat -a -n检查访问请求,发现119.42.245.*有几个IP异常(后面会提到如何判断异常IP),链接IP138检查IP来源,发现是阿里巴巴的(汗一下!阿里的IP段都是写的公司名称)。

笔者网站必够网是老牌的分类信息网站,而阿里旗下的口碑网是国内最大的分类信息站,百度收录量1400万,而赶集、58、百姓、必够网收录都在一千万以内(看来“业精于勤”啊,再汗一把)。

立即,使用iptables -I INPUT -s 119.42.245.0/16 -j DROP 命令封掉IP段,ok,一切搞定,负载逐步降低到5以下。

接下来的时间继续做功课,分析当日流量,删除垃圾信息(很重要,笔者以前曾经写过分类信息站淘汰法则—被垃圾、违法信息淹死?推荐大家看看)以及构思产品的改进策略。

过了一会有检查了一下负载,发现又上升到7了,于是依葫芦画瓢,又一个IP段出现我我视野61.135.249.*,这个IP段有点熟悉,似乎是搜索引擎爬虫,于是每2分钟netstat -a -n一下,COPY到ultraedit编辑器里,取3次记录,然后总结,发现这个IP段出现的次数都在35~40之间(百度爬虫的频率一般是37,不知道有站长研究过没),百度爬虫有61.135开头的爬虫段。

访问下网站,发现速度正常,看来专业爬虫的技术就是好,不会把人弄宕机。

另补充说明下如何判断异常IP:

看IP段 ,一些爬虫会自动换IP,防止被封。所以要看IP段出现的频率。不能确定的话可以隔段时间再看。

看IP地址,一般国外IP我都是直接封IP。

看抓取频率,搜索引擎的爬虫抓取频率会很合适,绝对不会长时间以超过你网站承受能力的频率抓。

OK,祝福各位站长身体事业两不误。