当前位置: 首页 > 图文教程 > 网络编程 > 正则表达式 > 去html代码的正则 推荐

正则表达式
RegExp对象的方法和属性
asp正则过滤重复字符串的代码
用Javascript正则实现url链接的解析类
正则表达式匹配 非XXX的行
正则表达式不包含属性
ASP正则函数替换分页后的参数
asp match正则函数使用Matchs实例
java正则表达式彻底研究
比较实用的正则表达式学习笔记
asp只采集网站可见文本的正则
asp.net常用正则表达式
js验证email的正则
java正则表达式验证函数
java 字符串匹配函数
js取得参数代码
Further Study of Rugular Expresions
正则表达式之全部符号对照表
正则文本框只能输入正整数
正则表达式在线测试工具
正则表达式提取网址、标题、图片等一例(.Net Asp Javascript/Js)的实现

正则表达式 中的 去html代码的正则 推荐


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-10   浏览: 67 ::
收藏到网摘: n/a

复制代码 代码如下:

'==================================================
'函数名:ScriptHtml
'作 用:过滤html标记
'参 数:ConStr ------ 要过滤的字符串
'==================================================
Function ScriptHtml(Byval ConStr,TagName,FType)
Dim Re
Set Re=new RegExp
Re.IgnoreCase =true
Re.Global=True
Select Case FType
Case 1
Re.Pattern="<" & TagName & "([^>])*>"
ConStr=Re.Replace(ConStr,"")
Case 2
Re.Pattern="<" & TagName & "([^>])*>.*?</" & TagName & "([^>])*>"
ConStr=Re.Replace(ConStr,"")
Case 3
Re.Pattern="<" & TagName & "([^>])*>"
ConStr=Re.Replace(ConStr,"")
Re.Pattern="</" & TagName & "([^>])*>"
ConStr=Re.Replace(ConStr,"")
End Select
ScriptHtml=ConStr
Set Re=Nothing
End Function
1 content=ScriptHtml(content,"br",1) ‘去掉所有<br>HTML标记
2 content=ScriptHtml(content,"a",2) ‘去掉所有<a></a>和两个标记之间的内容
如 <a href=www.126.com>www.126.com</a> 把这一段全去了
3 content=ScriptHtml(content,"td",3) ‘去掉<td>和</td>HTML标记
如 <td>士大夫撒</td> 把<td> </td> 去掉了 但士大夫撒还保留
依次类推把其他HTML标记都过滤了 div objdect什么的 自己看吧