asp.net HttpWebRequest自动识别网页编码- ASP.NET

当前位置: 首页 > 图文教程 > 网络编程 > ASP.NET > asp.net HttpWebRequest自动识别网页编码

ASP.NET: asp.net下用服务器端代码解决浏览器兼容性问题; asp.net 安全的截取指定长度的html或者ubb字符串; asp.net 在线编辑word文档可保存到服务器; asp.net 提高网站速度及如何利用缓存; asp.net 修改/删除站内目录操作后Session丢失问题; asp.net URL重写简化版速学URL重写; asp.net EncryptHelper 加密帮助类; asp.net JSONHelper JSON帮助类; C# 调用存储过程简单完整的实例代码; vs2008 安装失败的总结与分享; HttpHandler HttpModule入门篇; ASP.NET(AJAX+JSON)实现对象调用; Asp.net 基于Cookie简易的权限判断; asp.net通过HttpModule自动在Url地址上添加参数; asp.net 字符串、二进制、编码数组转换函数; ASP.NET操作Excel备忘录; 记录游客页面访问IP的简易实现代码 (asp.net+txt); 比较简单的将数据信息导入wrod文档方案(C# for word); 增加asp.net应用程序性能的20种方法(简单有效); ASP.NET 图片防盗链的实现原理分析

No. « ‹ 170 171 172 173 › »

技术文章搜索

关键字

ASP.NET 中的 asp.net HttpWebRequest自动识别网页编码

出处:互联网 整理: 软晨网（RuanChen.com） 发布: 2009-09-13 浏览: 80 ::

收藏到网摘: n/a

asp.net 网页编码自动识别代码 asp.net中调用winrar实现压缩解压缩的代码

HttpWebRequest获取网页源代码时自动识别网页编码，通过读取页面中的charset和读取http头中的编码信息获取页面的编码，基本可以正确获取网页编码

复制代码代码如下:

static string GetEncoding(string url) 
{ 
HttpWebRequest request = null; 
HttpWebResponse response = null; 
StreamReader reader = null; 
try 
{ 
request = (HttpWebRequest)WebRequest.Create(url); 
request.Timeout = 20000; 
request.AllowAutoRedirect = false; 
response = (HttpWebResponse)request.GetResponse(); 
if (response.StatusCode == HttpStatusCode.OK && response.ContentLength < 1024 * 1024) 
{ 
if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase)) 
reader = new StreamReader(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress)); 
else 
reader = new StreamReader(response.GetResponseStream(), Encoding.ASCII); 
string html = reader.ReadToEnd(); 
Regex reg_charset = new Regex(@"charset\b\s*=\s*(?<charset>[^""]*)"); 
if (reg_charset.IsMatch(html)) 
{ 
return reg_charset.Match(html).Groups["charset"].Value; 
} 
else if (response.CharacterSet != string.Empty) 
{ 
return response.CharacterSet; 
} 
else 
return Encoding.Default.BodyName; 
} 
} 
catch 
{ 
} 
finally 
{ 
if (response != null) 
{ 
response.Close(); 
response = null; 
} 
if (reader != null) 
reader.Close(); 
if (request != null) 
request = null; 
} 
return Encoding.Default.BodyName; 
} 
/// <summary> 
/// 获取源代码 
/// </summary> 
/// <param name="url"></param> 
/// <returns></returns> 
static string GetHtml(string url, Encoding encoding) 
{ 
HttpWebRequest request = null; 
HttpWebResponse response = null; 
StreamReader reader = null; 
try 
{ 
request = (HttpWebRequest)WebRequest.Create(url); 
request.Timeout = 20000; 
request.AllowAutoRedirect = false; 
response = (HttpWebResponse)request.GetResponse(); 
if (response.StatusCode == HttpStatusCode.OK && response.ContentLength < 1024 * 1024) 
{ 
if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase)) 
reader = new StreamReader(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress), encoding); 
else 
reader = new StreamReader(response.GetResponseStream(), encoding); 
string html = reader.ReadToEnd(); 
return html; 
} 
} 
catch 
{ 
} 
finally 
{ 
if (response != null) 
{ 
response.Close(); 
response = null; 
} 
if (reader != null) 
reader.Close(); 
if (request != null) 
request = null; 
} 
return string.Empty; 
}

asp.net 网页编码自动识别代码 asp.net中调用winrar实现压缩解压缩的代码

ASP.NET 中的 asp.net HttpWebRequest自动识别网页编码

评论 (0) All