asp.net HttpWebRequest自动识别网页编码- ASP.NET

当前位置: 首页 > 图文教程 > 网络编程 > ASP.NET > asp.net HttpWebRequest自动识别网页编码

ASP.NET: GridView添加删除按钮终极办法; AjaxPro让.NET的AjaxPro变得简单; c# 实现Word联接Excel的MailMerge功能; 解开Ajax技术中的达芬奇密码; 专家讲解用.NET编写串口程序的一点心得; 利用AJAX和ASP.NET实现简单聊天室; 如何快速捕获.NET代码中隐藏的BUG; 动态网页原理/.net面面观; 从N层到.NET详细剖析原理(2); 从N层到.NET详细剖析原理(1); ASP.NET效率陷阱之——Attributes; 在ASP.NET 2.0中建立站点导航层次(5); 在ASP.NET 2.0中建立站点导航层次(4); 在ASP.NET 2.0中建立站点导航层次(3); 在ASP.NET 2.0中建立站点导航层次(2); 在ASP.NET 2.0中建立站点导航层次(1); 动态网站Web开发PHP、ASP还是ASP.NET(2); 动态网站Web开发PHP、ASP还是ASP.NET(1); 让Apache支持ASP.NET-Apache，ASP.NET; .Net下的数据备份和还原

No. « ‹ 1 2 3 4 › »

技术文章搜索

关键字

ASP.NET 中的 asp.net HttpWebRequest自动识别网页编码

出处:互联网 整理: 软晨网（RuanChen.com） 发布: 2009-09-13 浏览: 71 ::

收藏到网摘: n/a

asp.net 网页编码自动识别代码 asp.net中调用winrar实现压缩解压缩的代码

HttpWebRequest获取网页源代码时自动识别网页编码，通过读取页面中的charset和读取http头中的编码信息获取页面的编码，基本可以正确获取网页编码

复制代码代码如下:

static string GetEncoding(string url) 
{ 
HttpWebRequest request = null; 
HttpWebResponse response = null; 
StreamReader reader = null; 
try 
{ 
request = (HttpWebRequest)WebRequest.Create(url); 
request.Timeout = 20000; 
request.AllowAutoRedirect = false; 
response = (HttpWebResponse)request.GetResponse(); 
if (response.StatusCode == HttpStatusCode.OK && response.ContentLength < 1024 * 1024) 
{ 
if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase)) 
reader = new StreamReader(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress)); 
else 
reader = new StreamReader(response.GetResponseStream(), Encoding.ASCII); 
string html = reader.ReadToEnd(); 
Regex reg_charset = new Regex(@"charset\b\s*=\s*(?<charset>[^""]*)"); 
if (reg_charset.IsMatch(html)) 
{ 
return reg_charset.Match(html).Groups["charset"].Value; 
} 
else if (response.CharacterSet != string.Empty) 
{ 
return response.CharacterSet; 
} 
else 
return Encoding.Default.BodyName; 
} 
} 
catch 
{ 
} 
finally 
{ 
if (response != null) 
{ 
response.Close(); 
response = null; 
} 
if (reader != null) 
reader.Close(); 
if (request != null) 
request = null; 
} 
return Encoding.Default.BodyName; 
} 
/// <summary> 
/// 获取源代码 
/// </summary> 
/// <param name="url"></param> 
/// <returns></returns> 
static string GetHtml(string url, Encoding encoding) 
{ 
HttpWebRequest request = null; 
HttpWebResponse response = null; 
StreamReader reader = null; 
try 
{ 
request = (HttpWebRequest)WebRequest.Create(url); 
request.Timeout = 20000; 
request.AllowAutoRedirect = false; 
response = (HttpWebResponse)request.GetResponse(); 
if (response.StatusCode == HttpStatusCode.OK && response.ContentLength < 1024 * 1024) 
{ 
if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase)) 
reader = new StreamReader(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress), encoding); 
else 
reader = new StreamReader(response.GetResponseStream(), encoding); 
string html = reader.ReadToEnd(); 
return html; 
} 
} 
catch 
{ 
} 
finally 
{ 
if (response != null) 
{ 
response.Close(); 
response = null; 
} 
if (reader != null) 
reader.Close(); 
if (request != null) 
request = null; 
} 
return string.Empty; 
}

asp.net 网页编码自动识别代码 asp.net中调用winrar实现压缩解压缩的代码

ASP.NET 中的 asp.net HttpWebRequest自动识别网页编码

评论 (0) All