当前位置: 首页 > 图文教程 > 网络编程 > ASP.NET > .NET开发中正则表达式中BUG一例

ASP.NET
asp.net Linq To Xml上手Descendants、Elements遍历节点
asp.net 过滤图片标签的正则
ASP.NET Session会导致的性能问题
asp.net 客户端浏览器缓存的Http头介绍
ASP.NET 常用 文件上传方法
异步 HttpContext.Current实现取值的方法(解决异步Application,Session,Cache...等失效的问题)
asp.net Datalist控件实现分页功能
c#中带头(声明)的xml(封装)生成
asp.net BOF或EOF有一个是真,或者当前记录已被删除
asp.net 多数据库支持的思考
一个简单的自定义程序日志小样例
asp.net DataSet进行排序
常用JavaScript代码提示公共类封装
ASP.NET 服务器路径和一般资源调用
使用母版页时内容页如何使用css和javascript
asp.net datalist 用法
asp.net js模拟Button点击事件
ASP.NET Web Page应用深入探讨
动态向页面添加控件和使用正则表达式的代码
Asp.net 连接MySQL的实现代码[]

ASP.NET 中的 .NET开发中正则表达式中BUG一例


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-23   浏览: 91 ::
收藏到网摘: n/a

又发现了一个 .net的bug!最近在使用正则表达式的时候发现:在忽略大小写的时候,匹配值从 0xff 到 0xffff 之间的所有字符,正则表达式竟然也能匹配两个 ASCII 字符:i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和数字。

比如以下的代码就是用来测试用正则表达式匹配从 0xff 到 0xffff 的字符。而值范围在 0 到 0xfe 的所有字符是不能被匹配的。  

以下为引用的内容:

1234567891011121314151617Regex regex = new Regex(@"[/u00FF-/uFFFF]+");

  // The characters, whoes value are smaller than 0xff,

  // are not expected to be matched.

  for (int i = 0; i <0xff; i++) {

  string s = new string(new char[] { (char)i });

  Debug.Assert(!regex.IsMatch(s), string.Format(

  "The character was not expected to be matched: 0x{0:X}!", i));

  }

  // However, the characters whoes value

  // are greater than 0xfe are expected to be matched.

  for (int i = 0xff; i <= 0xffff; i++) {

  string s = new string(new char[] { (char)i });

  Debug.Assert(regex.IsMatch(s), string.Format(

  "The character was expected to be matched: 0x{0:X}!", i));

  }

这时的运行结果是正常的,没有任何的断言错误出现。

然而当使用忽略大小写的匹配模式时,结果就不一样了。将上面代码中的第一行改成:

1Regex regex = new Regex(@"[/u00FF-/uFFFF]+", RegexOptions.IgnoreCase);

程序运行的时候就会有两处断言错误。它们分别是字符值为 73 和 105,也就是小写字母 i 和大写字母 I。 这个 bug 非常奇怪,别的字符都很正常!而且用 javascript脚本在 IE (版本是6.0)里面运行也同样有这么 bug 存在(比如下面这段代码)。然而在 Firefox中运行就是没有问题的。还是 Firefox 好啊,呵呵!

以下为引用的内容:

1234567891011121314151617var re = /[/u00FF-/uFFFF]+/;

  // var re = /[/u00FF-/uFFFF]+/i;

  for(var i=0; i<0xff; i++) {

  var s = String.fromCharCode( i );

  if ( re.test(s) ) {

  alert( 'Should not be matched: ' + i + '!' );

  }

  }

  for(var i=0xff; i<=0xffff; i++) {

  var s = String.fromCharCode( i );

  if ( !re.test(s) ) {

  alert( 'Should be matched: ' + i + '!' );

  }

  }