当前位置: 首页 > 图文教程 > 网站运营 > 建站经验 > linux运维实战:K掉口碑,欢迎百度

建站经验
给站长的建站建议 优化性能提高网站质量
15个Web开发必备的Firefox扩展插件
教你合理更换网站新域名
网站搜索引擎优化 Meta元标签的详细介绍
站长们 还在给别人做嫁衣吗?
企业网站的常见问题细细数
做网站也要有事件营销意识
批量删除sql中被注入的恶意代码
从我的一篇牢骚文被转载看新站的原创
美橙建站宝典系列:域名陷阱见招拆招(一)
Drupal入门教程之站点设置篇
新站上线切忌轻举妄动 四点最忌讳的错误
DDoS攻击的趋势与防御策略
把网站采集内容变成原创 七个方法帮你忙
B2C电子商务网站运营之目标市场及用户调查
Drupal入门教程之----用户管理
5年的作站经历到做技术在回到做站
Drupal入门教程之---状态报告
获得可能点击的六大技巧
个人站应该定位一下自己

建站经验 中的 linux运维实战:K掉口碑,欢迎百度


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 75 ::
收藏到网摘: n/a

相信很多有经验的站长和我一样,每天观察流量统计,同样,今天也不例外。

早上上班后就发现今天流量PV(点击量)有点低,但是IP并没低多少,当时也没在意,因为周三流量通常比周二要低一点。

笔者网站使用的是linux环境,晚上的时候就发现网站速度比较慢,因为刚刚把服务器换到电信A类机房,所以速度还是有点信心的。于是使用top命令检查负载,发现负载超过40,一般负载超过10速度就会慢下来,按照往常的经验,who、ps等命令检查链接和进程,接着使用netstat -a -n检查访问请求,发现119.42.245.*有几个IP异常(后面会提到如何判断异常IP),链接IP138检查IP来源,发现是阿里巴巴的(汗一下!阿里的IP段都是写的公司名称)。

笔者网站必够网是老牌的分类信息网站,而阿里旗下的口碑网是国内最大的分类信息站,百度收录量1400万,而赶集、58、百姓、必够网收录都在一千万以内(看来“业精于勤”啊,再汗一把)。

立即,使用iptables -I INPUT -s 119.42.245.0/16 -j DROP 命令封掉IP段,ok,一切搞定,负载逐步降低到5以下。

接下来的时间继续做功课,分析当日流量,删除垃圾信息(很重要,笔者以前曾经写过分类信息站淘汰法则—被垃圾、违法信息淹死?推荐大家看看)以及构思产品的改进策略。

过了一会有检查了一下负载,发现又上升到7了,于是依葫芦画瓢,又一个IP段出现我我视野61.135.249.*,这个IP段有点熟悉,似乎是搜索引擎爬虫,于是每2分钟netstat -a -n一下,COPY到ultraedit编辑器里,取3次记录,然后总结,发现这个IP段出现的次数都在35~40之间(百度爬虫的频率一般是37,不知道有站长研究过没),百度爬虫有61.135开头的爬虫段。

访问下网站,发现速度正常,看来专业爬虫的技术就是好,不会把人弄宕机。

另补充说明下如何判断异常IP:

看IP段 ,一些爬虫会自动换IP,防止被封。所以要看IP段出现的频率。不能确定的话可以隔段时间再看。

看IP地址,一般国外IP我都是直接封IP。

看抓取频率,搜索引擎的爬虫抓取频率会很合适,绝对不会长时间以超过你网站承受能力的频率抓。

OK,祝福各位站长身体事业两不误。