当前位置: 首页 > 图文教程 > 网络编程 > 正则表达式 > [正则表达式]贪婪模式与非贪婪模式

正则表达式
正则表达式 特殊字符应用分析[简单详细入门必看]
asp.net 正则表达式[经常用的到]
javascript 小时:分钟的正则表达式
又一篇正则表达式学习笔记
正则获取图片地址 链接地址
JavaScript 去前后全脚半脚空格的正则
PHP 正则表达式分析RSS
关于内容的分离,正则抽出图片(一定要加精哦)
Javascript lastIndex 正则表达式的一个疑惑
asp去掉html,保留img br p div的正则实现代码
JavaScript 正则表达式解析
正则表达式轻松消除HTML代码
常用正则表达式 整理篇
c# 正则表达式对网页进行有效内容抽取
常用正则表达式 比较实用
javascript 正则修正符
C# 正则表达式经典分类整理集合手册
js mac地址 正则表达式
正则表达式 口诀 学习正则的朋友看看
javascript RegExp对象(正则表达式)

[正则表达式]贪婪模式与非贪婪模式


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-13   浏览: 47 ::
收藏到网摘: n/a

复制代码 代码如下:

/**
** author: site120
** function : get script part from html document
**/
var loadJs = function(str , delayTime)
{
var delayTime = delayTime || 100;
var regExp_scriptTag = new RegExp("<\\s*script([^>]*)>([\\s\\S]*?)</\\s*script\\s*>" , "gi");
var regExp_scriptAttrib_src = new RegExp("\\s*src?\\s*=\\s*(\"([^\"]+)\"|\'([^\']+)\'|\\s*([^\\s]+)\\s*)" , "gi");
var arr_scriptTag = null;
var arr_scriptAttib = null;
var scriptData = "";
var jsList = new Array();
while ((arr_scriptTag=regExp_scriptTag.exec(str)) != null)
{
while ((arr_scriptAttib=regExp_scriptAttrib_src.exec(arr_scriptTag[1])) != null)
{
if (arr_scriptAttib[3])
{
jsList.push(arr_scriptAttib[3]);
}
else if (arr_scriptAttib[2])
{
jsList.push(arr_scriptAttib[2]);
}
else
{
jsList.push(arr_scriptAttib[1]);
}
}
scriptData += (arr_scriptTag[2]);
}
for (var i=0; i<jsList.length; i++)
{
var script = document.createElement("script");
script.src = jsList[i];
document.body.appendChild(script);
}
if (scriptData.length > 0)
{
var fn = "_siteFunction_" + new Date().getTime() + "_" + parseInt(Math.random()*10000) + "_120";
scriptData = " var " + fn + " = function(){ " + scriptData + " }; "+fn+"();"
window.eval(scriptData);
}
}

这是用Js来处理正则表达式,原理与Java一样,
功能是读取一段网页源代码,并将它里面所有的script标签,截取并加载运行。
这里面的[\s\S]*?利用非贪婪模式来匹配最近script标签之间的所有代码。包括换行