当前位置: 首页 > 图文教程 > 网络编程 > 正则表达式 > asp只采集网站可见文本的正则

正则表达式
去除内容中的html
转换文本为超连接和Email格式的代码
正则表达式regular expression详述(一)
正则表达式regular expression详述(二)
17种正则表达式
正则表达式练习器
ubbcode简单实用
在ASP中用“正则表达式对象”来校验数据的合法性
JScript中正则表达函数的说明与应用
截字符串 去除HTML标记
学习网址
ubb代码转换为html
Javascript正则表达式测试网页
正则表达式验证
一个特牛的日期时间判断正则表达式
好东西,老外用正则表达式写的HTML分离函数
asp的ubb函数(推荐)
正则表达式中的特殊字符
常用的匹配正则表达式和实例
正则表达式在UBB论坛中的应用

正则表达式 中的 asp只采集网站可见文本的正则


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-13   浏览: 90 ::
收藏到网摘: n/a

它可以过虑Js 可以过滤 CSS 过滤HTML标识,只采集页面的可见文本。
我写的是这样:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.IgnoreCase = True
reg.Global = True
reg.Pattern = "(<s+cript(.+?)<\/s+cript>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "(<s+tyle(.+?)<\/s+tyle>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "<[^>]*>"
originCode= reg.Replace(originCode, "")
ClearHTMLCode = originCode
End Function
不过有一些过滤不了!而且速度太慢!