当前位置: 首页 > 图文教程 > 网络编程 > 正则表达式 > 正则 捕获组(capture group)

正则表达式
常用正则表达式及评注-学习正则必备
asp常用的正则表达式实现字符串的替换
计算一个字符串在另一字符串中出现的次数函数
JavaScript 正则表达式使用详细参数
javascript判断中文的正则
最常用的PHP正则表达式收集整理
正则表达式在网页处理中的应用四则
asp正则表达式匹配数字$数字$数字$
asp去除html标记与空格的正则
JScript 8.0 正则表达式语法
PHP 正则 email语句详解
用js实现过滤script的正则
javascript正则表达式分析
正则表达式学习经验分析
web标准知识——丰富段落里的标签
php 正则表达式学习笔记
正则表达式口诀_学习正则的朋友值得一看
asp+正则获得字符串中最后一个字母非字母不算
php下常用表单验证的正则表达式
JavaScript正则表达式之后向引用实例代码

正则表达式 中的 正则 捕获组(capture group)


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-13   浏览: 49 ::
收藏到网摘: n/a

捕获组就是把正则表达式中子表达式匹配的内容,保存到内存中以数字编号或手动命名的组里,方便后面引用
捕获组有两种形式
一种是普通的捕获组,不产生歧义的情况下,后面简称捕获组,语法规则:(expression);
另一种是命名捕获组,语法规则:(?<name>expression)或者(?'name'expression),这两种写法是等价的。
1、编号规则
如果没有显式为捕获组命名,即没有使用命名捕获组,那么需要按数字顺序来访问所有捕获组
在只有普通捕获组的情况下,捕获组的编号是按照“(”出现的顺序,从左到右编号的
(\d{4})-(\d{2}-(\d\d))
1 1 2 3 3 2
上面的正则表达式可以用来匹配格式为yyyy-MM-dd的日期,为了在下表中得以区分,采用了\d{2}和\d\d两种写法
还有一个默认编号为0的组,表示的是正则表达式的整体
用以上正则表达式匹配字符串:2008-12-31
匹配结果为:
编号 命名 捕获组 匹配内容
0 (\d{4})-(\d{2}-(\d\d)) 2008-12-31
1 (\d{4}) 2008
2 (\d{2}-(\d\d)) 12-31
3 (\d\d) 31
如果对组进行了显式命名,即命名捕获组,那么捕获的内容可以通过组名称来引用
但是如果正则表达式中既使用了普通捕获组,也使用了命名捕获组,那么捕获组的编号就要特别注意,编号的规则是先对普通捕获组进行编号,再对命名捕获组进行编号
(\d{4})-(?<date>\d{2}-(\d\d))
1 1 3 2 23
用以上正则表达式匹配字符串:2008-12-31
匹配结果为:
编号 命名 捕获组 匹配内容
0 (\d{4})-(\d{2}-(\d\d)) 2008-12-31
1 (\d{4}) 2008
2 (\d\d) 31
3 date (?<date>\d{2}-(\d\d)) 12-31
2、捕获组的引用
对捕获组的引用一般有以下几种
a) 正则表达式中,对前面捕获组捕获的内容进行引用,称为反向引用
b) 正则表达式中,(?(表达式)true|false)的条件表达式
c) 在程序中,对捕获组捕获内容的引用
反向引用
对于普通捕获组的引用,语法规则为:\k<num>,通常简写为\num,其中num是十进制的数字,即捕获组的编号
对于命名捕获组的引用,语法规则为:\k<name>或者\k'name'