asp.net HttpWebRequest自动识别网页编码- ASP.NET

当前位置: 首页 > 图文教程 > 网络编程 > ASP.NET > asp.net HttpWebRequest自动识别网页编码

ASP.NET: asp.net Linq TO Sql 分页方法; asp.net 用XML生成放便扩展的自定义树; asp.ent下合并两个结构相同的DataTable; asp.net 遍历repeater中的控件的几种方式; asp.net 处理原文件中过长的viewstate代码; asp.net下遍历页面中所有的指定控件的代码; 获取创建Membership的数据库创建脚本; asp.net AJAX注册类; asp.net 处理F5刷新页面重复提交页面的一个思路; ASP.NET 缓存分析和实践浅析提高运行效率; asp.net 读取并显示excel数据的实现代码; ASP.NET中常用的用来输出JS脚本的类; ASP.NET中内嵌页面代码的一个问题; asp.net(C#)操作excel（上路篇）; 一个基于Asp.Net MVC的权限方案; ASP.NET实例教程:51job网站地区选择功能; ASP.NET教程:友好的Html和JS适合SEO; ASP.NET教程:使用.ashx文件去除重复内容; ASP.NET做SEO：制作架构清晰和更新及时的网站地图; ASP.NET优化:Sql注入和Html注入的黑帽SEO

No. « ‹ 172 173 174 175 › »

技术文章搜索

关键字

ASP.NET 中的 asp.net HttpWebRequest自动识别网页编码

出处:互联网 整理: 软晨网（RuanChen.com） 发布: 2009-09-13 浏览: 75 ::

收藏到网摘: n/a

asp.net 网页编码自动识别代码 asp.net中调用winrar实现压缩解压缩的代码

HttpWebRequest获取网页源代码时自动识别网页编码，通过读取页面中的charset和读取http头中的编码信息获取页面的编码，基本可以正确获取网页编码

复制代码代码如下:

static string GetEncoding(string url) 
{ 
HttpWebRequest request = null; 
HttpWebResponse response = null; 
StreamReader reader = null; 
try 
{ 
request = (HttpWebRequest)WebRequest.Create(url); 
request.Timeout = 20000; 
request.AllowAutoRedirect = false; 
response = (HttpWebResponse)request.GetResponse(); 
if (response.StatusCode == HttpStatusCode.OK && response.ContentLength < 1024 * 1024) 
{ 
if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase)) 
reader = new StreamReader(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress)); 
else 
reader = new StreamReader(response.GetResponseStream(), Encoding.ASCII); 
string html = reader.ReadToEnd(); 
Regex reg_charset = new Regex(@"charset\b\s*=\s*(?<charset>[^""]*)"); 
if (reg_charset.IsMatch(html)) 
{ 
return reg_charset.Match(html).Groups["charset"].Value; 
} 
else if (response.CharacterSet != string.Empty) 
{ 
return response.CharacterSet; 
} 
else 
return Encoding.Default.BodyName; 
} 
} 
catch 
{ 
} 
finally 
{ 
if (response != null) 
{ 
response.Close(); 
response = null; 
} 
if (reader != null) 
reader.Close(); 
if (request != null) 
request = null; 
} 
return Encoding.Default.BodyName; 
} 
/// <summary> 
/// 获取源代码 
/// </summary> 
/// <param name="url"></param> 
/// <returns></returns> 
static string GetHtml(string url, Encoding encoding) 
{ 
HttpWebRequest request = null; 
HttpWebResponse response = null; 
StreamReader reader = null; 
try 
{ 
request = (HttpWebRequest)WebRequest.Create(url); 
request.Timeout = 20000; 
request.AllowAutoRedirect = false; 
response = (HttpWebResponse)request.GetResponse(); 
if (response.StatusCode == HttpStatusCode.OK && response.ContentLength < 1024 * 1024) 
{ 
if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase)) 
reader = new StreamReader(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress), encoding); 
else 
reader = new StreamReader(response.GetResponseStream(), encoding); 
string html = reader.ReadToEnd(); 
return html; 
} 
} 
catch 
{ 
} 
finally 
{ 
if (response != null) 
{ 
response.Close(); 
response = null; 
} 
if (reader != null) 
reader.Close(); 
if (request != null) 
request = null; 
} 
return string.Empty; 
}

asp.net 网页编码自动识别代码 asp.net中调用winrar实现压缩解压缩的代码

ASP.NET 中的 asp.net HttpWebRequest自动识别网页编码

评论 (0) All