asp.net(c#)捕捉搜索引擎蜘蛛和机器人- ASP.NET

当前位置: 首页 > 图文教程 > 网络编程 > ASP.NET > asp.net(c#)捕捉搜索引擎蜘蛛和机器人

ASP.NET: ASP.Net分页控件源码; Community Server专题一：概述Community Server; Community Server专题三：HttpModule; relaxlife.net发布一个自己开发的中文分词程序; RLCSS分词系统更新下载; asp.net获取SQL所有数据库名、所有表名、所有字段名; asp.net下获取Excel所有的工作表名称; Asp.Net常用函数; asp.net下用url重写URLReWriter实现任意二级域名的方法; 在.NET中利用XMLHTTP下载文件的代码; 在ASP.NET 中实现单点登录; c# .net 生成图片验证码的代码; asp.net中MD5 16位和32位加密函数; 自己常用到的自定义公共类(已测试通过); ASP.NET 2.0下随机读取Access记录的实现方法; .NET(C#)连接各类数据库代码-集锦; nunit使用指南之—NUnit Quick Start; ASP.NET中读取XML文件信息的4种方法与示例代码; asp.net中获取远程网页的内容之一（downmoon原创）; asp.net下获取远程网页的内容之二（downmoon原创）

No. « ‹ 38 39 40 41 › »

技术文章搜索

关键字

ASP.NET 中的 asp.net(c#)捕捉搜索引擎蜘蛛和机器人

出处:互联网 整理: 软晨网（RuanChen.com） 发布: 2009-09-13 浏览: 202 ::

收藏到网摘: n/a

asp.net实例代码protected override void Render(HtmlTextWriter writer) 深入理解__doPostBack 客户端调用服务端事件

结合这个你就可以写一个蜘蛛访问记录了，如何判断正常用户或者蜘蛛？可以粗略的这样来判断：通过判断用户的访问来源页面下面是访问日志文件
2008-8-13 14:43:22
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 1.1.4322)

2008-8-13 14:43:27
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 1.1.4322)

2008-8-13 14:44:18
Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)

2008-8-13 14:44:26
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; QQDownload 1.7; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)

2008-8-13 14:45:17
Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
打开这个文件，这个文件用于记录访问搜索吧的正常访客或者机器人蜘蛛，从中提取的蜘蛛有： Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Gigabot/3.0 (http://www.gigablast.com/spider.html)
Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
Mozilla/5.0 (compatible; YodaoBot/1.0; http://www.yodao.com/help/webmaster/spider/; )
Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
msnbot/1.1 (+http://search.msn.com/msnbot.htm)
Baiduspider+(+http://www.baidu.com/search/spider.htm)
代码也十分的简单：

复制代码代码如下:

string agent = System.Web.HttpContext.Current.Request.ServerVariables["HTTP_USER_AGENT"]; 
if (agent == null) 
{ 
Response.Write("Other"); 
} 
else 
{ 
Response.Write(agent); 
} 

你可以自己用这个代码试下，发现会输出类似： Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; TencentTraveler 4.0; .NET CLR 2.0.50727; .NET CLR 1.1.4322)
结合这个你就可以写一个蜘蛛访问记录了，如何判断正常用户或者蜘蛛？可以粗略的这样来判断：通过判断用户的访问来源页面，比如从ruanchen.com/ndex.htm这个文件点进show.asp?id=11那么他的来源页面我们知道就是ruanchen.com/ndex.htm，那么粗略判断他就是正常客户。而蜘蛛的来源则不是，把这部分不是的记录下来，再从中选择。可以结合数据库进行记录。

asp.net实例代码protected override void Render(HtmlTextWriter writer) 深入理解__doPostBack 客户端调用服务端事件

ASP.NET 中的 asp.net(c#)捕捉搜索引擎蜘蛛和机器人

评论 (0) All