当前位置: 首页 > 图文教程 > 网络编程 > PHP > PHP教程:preg_replace_callback()函数

PHP
用PHP实现Ftp用户的在线管理
用PHP实现分段下载
最令PHP初学者头痛的十四个问题
用PHP写的MD5加密函数
PHP应用程序加速探索之简介
将SSH与PHP相连接 确保传输数据的安全
PHP制作的仿百度的站内搜索引擎代码
PHP读取汉字点阵数据
PHP实现任意字符集下正常显示网页的方法
利用PHP的OOP特性实现数据保护
关于PHP字符集的问题
新手入门:IIS6环境下的PHP最佳配置方法
新手入门:初学动态网页PHP的18个例子
基于PHP的AJAX技术实现文件异步上传
PHP技巧--通过COM使用ADODB
PHP技巧:正确理解PHP程序编译时的错误信息
PHP技巧:分析利用PHP制作新闻系统的步骤
PHP技巧:通过实例深入剖析require和include的用法
PHP技巧:优化动态网页技术PHP程序的12条技巧
PHP技巧:使用APC缓存优化PHP程序

PHP教程:preg_replace_callback()函数


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-28   浏览: 42 ::
收藏到网摘: n/a

最近碰到一个问题,要在一段HTML代码的链接中加一个参数,比如其中由一个A标签是这样的:

1
<a href="http://www.example.com/aaa.php">链接文字</a>

我就要在 aaa.php 的后面加上一个参数使其变成 aaa.php?request=xxx ,但问题是不是所有的链接都是aaa.php这样的形式,可能后面已经有了别的参数,比如 aaa.php?id=111 ,这样加的时候就需要把链接变成 aaa.php?id=111&request=xxx 。

由于要处理的是一大块HTML,所以首先想到的解决方案是正则替换,不过 preg_replace 不能做条件判断,只能做一种替换,然后我就找到了 preg_replace_callback() 这个函数,大喜,以为找到了银弹。这个东西的用法和 preg_replace() 函数几乎一样,不过它提供了一个 callback 函数,可以在替换的时候根据条件替换。在PHP手册中提供了这么一个例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
<?php // 此文本是用于 2002 年的, // 现在想使其能用于 2003 年 $text = "April fools day is 04/01/2002\n"; $text.= "Last christmas was 12/24/2001\n";
  // 回调函数 function next_year($matches) { // 通常:$matches[0] 是完整的匹配项 // $matches[1] 是第一个括号中的子模式的匹配项 // 以此类推 return $matches[1].($matches[2]+1); }
  echo preg_replace_callback( "|(\d{2}/\d{2}/)(\d{4})|", "next_year", $text);
  // 结果为: // April fools day is 04/01/2003 // Last christmas was 12/24/2002
?>

看了这个例子之后我以为只要把想要替换的内容替换掉就OK了,比如我只想更改捕获的第二个匹配项,只需要把 $matches[2]中的内容改一下返回就行了。然后我就写了下面的代码测试:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
$content = '<a href="http://www.example.com/aaa.php">链接1</a><a href="http://www.example.com/aaa.php?id=111">链接2</a>';
 
$content = preg_replace_callback('/href=[\'|"](.*?)[\'|"]/', 'add_request', $content);
 
// 下面是 add_request 函数定义
 
function add_source($matches)
{ if(strpos($matches[1], '?')) { return $matches[1].'&request=xxx'; } else { return $matches[1].'?request=xxx'; }
}

不过实验之后却发现把代码替换得乱七八糟,我找了半天都没发现哪里出错了。后来仔细检查了一下才恍然大悟,我被手册上的例子误导了!!其实这个函数会替换匹配的整个内容,即 /href=[\'|"](.*?)[\'|"]/ (包括 href),而不只是 (.*?) 所捕获的东西。而手册例子中的正则是这样的:|(\d{2}/\d{2}/)(\d{4})| ,它的所有部分都是在()内的,所以替换成 $matches[1].($matches[2]+1) 自然不会有问题,但是它却让我误以为这个函数会有针对性地替换 $matches[1] 和 $matches[2]中的内容,事实上它还是替换整个正则匹配的内容,即 $matches[0]中的内容,而加上的括号只是为了我们对字符串操作方便而已!了解这一点之后,修改了代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
$content = '<a href="http://www.example.com/aaa.php">链接1</a><a href="http://www.example.com/aaa.php?id=111">链接2</a>';
 
$content = preg_replace_callback('/href=[\'|"](.*?)[\'|"]/', 'add_request', $content);
 
// 下面是 add_request 函数定义
 
function add_source($matches)
{ if(strpos($matches[1], '?')) { return 'href="'.$matches[1].'&request=xxx"'; //注意,这里和下面都加上了正则里括号外的东西:href=" } else { return 'href="'.$matches[1].'?request=xxx"'; }
}

改好之后,测试正常。

一点学习笔记,记录在此。