当前位置: 首页 > 图文教程 > 网络编程 > PHP > PHP教程:preg_replace_callback()函数

PHP
php 远程图片保存到本地的函数类
php 破解防盗链图片函数
快速开发一个PHP扩展图文教程
PHP6 mysql连接方式说明
php 进度条实现代码
php discuz 主题表和回帖表的设计
php 无限级缓存的类的扩展
php adodb操作mysql数据库
php FPDF类库应用实现代码
sourcesafe管理phpproj文件的补充说明(downmoon)
AspNetAjaxPager,Asp.Net通用无刷新Ajax分页控件,支持多样式多数据绑定
php一句话cmdshell新型 (非一句话木马)
php 木马的分析(加密破解)
PHP 数组入门教程小结
php 方便水印和缩略图的图形类
PHP加速 eAccelerator配置和使用指南
PHP 组件化编程技巧
IIS6+PHP5+MySQL5+Zend Optimizer+phpMyAdmin安装配置图文教程 2009年
两个强悍的php 图像处理类1
PHP 数据库 常见问题小结

PHP教程:preg_replace_callback()函数


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-28   浏览: 73 ::
收藏到网摘: n/a

最近碰到一个问题,要在一段HTML代码的链接中加一个参数,比如其中由一个A标签是这样的:

1
<a href="http://www.example.com/aaa.php">链接文字</a>

我就要在 aaa.php 的后面加上一个参数使其变成 aaa.php?request=xxx ,但问题是不是所有的链接都是aaa.php这样的形式,可能后面已经有了别的参数,比如 aaa.php?id=111 ,这样加的时候就需要把链接变成 aaa.php?id=111&request=xxx 。

由于要处理的是一大块HTML,所以首先想到的解决方案是正则替换,不过 preg_replace 不能做条件判断,只能做一种替换,然后我就找到了 preg_replace_callback() 这个函数,大喜,以为找到了银弹。这个东西的用法和 preg_replace() 函数几乎一样,不过它提供了一个 callback 函数,可以在替换的时候根据条件替换。在PHP手册中提供了这么一个例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
<?php // 此文本是用于 2002 年的, // 现在想使其能用于 2003 年 $text = "April fools day is 04/01/2002\n"; $text.= "Last christmas was 12/24/2001\n";
  // 回调函数 function next_year($matches) { // 通常:$matches[0] 是完整的匹配项 // $matches[1] 是第一个括号中的子模式的匹配项 // 以此类推 return $matches[1].($matches[2]+1); }
  echo preg_replace_callback( "|(\d{2}/\d{2}/)(\d{4})|", "next_year", $text);
  // 结果为: // April fools day is 04/01/2003 // Last christmas was 12/24/2002
?>

看了这个例子之后我以为只要把想要替换的内容替换掉就OK了,比如我只想更改捕获的第二个匹配项,只需要把 $matches[2]中的内容改一下返回就行了。然后我就写了下面的代码测试:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
$content = '<a href="http://www.example.com/aaa.php">链接1</a><a href="http://www.example.com/aaa.php?id=111">链接2</a>';
 
$content = preg_replace_callback('/href=[\'|"](.*?)[\'|"]/', 'add_request', $content);
 
// 下面是 add_request 函数定义
 
function add_source($matches)
{ if(strpos($matches[1], '?')) { return $matches[1].'&request=xxx'; } else { return $matches[1].'?request=xxx'; }
}

不过实验之后却发现把代码替换得乱七八糟,我找了半天都没发现哪里出错了。后来仔细检查了一下才恍然大悟,我被手册上的例子误导了!!其实这个函数会替换匹配的整个内容,即 /href=[\'|"](.*?)[\'|"]/ (包括 href),而不只是 (.*?) 所捕获的东西。而手册例子中的正则是这样的:|(\d{2}/\d{2}/)(\d{4})| ,它的所有部分都是在()内的,所以替换成 $matches[1].($matches[2]+1) 自然不会有问题,但是它却让我误以为这个函数会有针对性地替换 $matches[1] 和 $matches[2]中的内容,事实上它还是替换整个正则匹配的内容,即 $matches[0]中的内容,而加上的括号只是为了我们对字符串操作方便而已!了解这一点之后,修改了代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
$content = '<a href="http://www.example.com/aaa.php">链接1</a><a href="http://www.example.com/aaa.php?id=111">链接2</a>';
 
$content = preg_replace_callback('/href=[\'|"](.*?)[\'|"]/', 'add_request', $content);
 
// 下面是 add_request 函数定义
 
function add_source($matches)
{ if(strpos($matches[1], '?')) { return 'href="'.$matches[1].'&request=xxx"'; //注意,这里和下面都加上了正则里括号外的东西:href=" } else { return 'href="'.$matches[1].'?request=xxx"'; }
}

改好之后,测试正常。

一点学习笔记,记录在此。