asp.net HttpWebRequest自动识别网页编码- ASP.NET

当前位置: 首页 > 图文教程 > 网络编程 > ASP.NET > asp.net HttpWebRequest自动识别网页编码

ASP.NET: asp.net 使用Silverlight操作ASPNETDB数据库; ASP.NET 前后台调用方法; ASP.NET中等安全模式的一些经验分享; asp.net 打印控件使用方法; 网站开发技术:ASP.NET 2.0搭建网站; ASP.NET实例教程:创建数据透视表; ASP.NET 4进行SEO优化提高网站排名和权重; ASP.NET实例教程:订阅 GeoRSS 订阅源; ASP.NET页面间数据传递的9种方法; ASP.NET教程:网页表单多个按钮完成不同功能; Asp.net的服务器推技术 (Server Push); asp.net 无刷新附件上传实现方法; ASP.NET 定制简单的错误处理页面实现代码; c# 在WebBrowser中用SendMessage模拟鼠标点击; asp.net 表单验证新思路; .NET从优酷专辑中采集所有视频及信息（VB.NET代码）; VS2005 水晶报表在时部署时遇到的问题; ASP.NET 输出图片简单代码; 一天精通asp.net的学习经验小结; DataGridView中绑定DataTable数据及相关操作实现代码

No. « ‹ 171 172 173 174 › »

技术文章搜索

关键字

ASP.NET 中的 asp.net HttpWebRequest自动识别网页编码

出处:互联网 整理: 软晨网（RuanChen.com） 发布: 2009-09-13 浏览: 82 ::

收藏到网摘: n/a

asp.net 网页编码自动识别代码 asp.net中调用winrar实现压缩解压缩的代码

HttpWebRequest获取网页源代码时自动识别网页编码，通过读取页面中的charset和读取http头中的编码信息获取页面的编码，基本可以正确获取网页编码

复制代码代码如下:

static string GetEncoding(string url) 
{ 
HttpWebRequest request = null; 
HttpWebResponse response = null; 
StreamReader reader = null; 
try 
{ 
request = (HttpWebRequest)WebRequest.Create(url); 
request.Timeout = 20000; 
request.AllowAutoRedirect = false; 
response = (HttpWebResponse)request.GetResponse(); 
if (response.StatusCode == HttpStatusCode.OK && response.ContentLength < 1024 * 1024) 
{ 
if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase)) 
reader = new StreamReader(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress)); 
else 
reader = new StreamReader(response.GetResponseStream(), Encoding.ASCII); 
string html = reader.ReadToEnd(); 
Regex reg_charset = new Regex(@"charset\b\s*=\s*(?<charset>[^""]*)"); 
if (reg_charset.IsMatch(html)) 
{ 
return reg_charset.Match(html).Groups["charset"].Value; 
} 
else if (response.CharacterSet != string.Empty) 
{ 
return response.CharacterSet; 
} 
else 
return Encoding.Default.BodyName; 
} 
} 
catch 
{ 
} 
finally 
{ 
if (response != null) 
{ 
response.Close(); 
response = null; 
} 
if (reader != null) 
reader.Close(); 
if (request != null) 
request = null; 
} 
return Encoding.Default.BodyName; 
} 
/// <summary> 
/// 获取源代码 
/// </summary> 
/// <param name="url"></param> 
/// <returns></returns> 
static string GetHtml(string url, Encoding encoding) 
{ 
HttpWebRequest request = null; 
HttpWebResponse response = null; 
StreamReader reader = null; 
try 
{ 
request = (HttpWebRequest)WebRequest.Create(url); 
request.Timeout = 20000; 
request.AllowAutoRedirect = false; 
response = (HttpWebResponse)request.GetResponse(); 
if (response.StatusCode == HttpStatusCode.OK && response.ContentLength < 1024 * 1024) 
{ 
if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase)) 
reader = new StreamReader(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress), encoding); 
else 
reader = new StreamReader(response.GetResponseStream(), encoding); 
string html = reader.ReadToEnd(); 
return html; 
} 
} 
catch 
{ 
} 
finally 
{ 
if (response != null) 
{ 
response.Close(); 
response = null; 
} 
if (reader != null) 
reader.Close(); 
if (request != null) 
request = null; 
} 
return string.Empty; 
}

asp.net 网页编码自动识别代码 asp.net中调用winrar实现压缩解压缩的代码

ASP.NET 中的 asp.net HttpWebRequest自动识别网页编码

评论 (0) All