当前位置: 首页 > 图文教程 > 网络编程 > 正则表达式 > asp只采集网站可见文本的正则

正则表达式
js 常用正则表达式表单验证代码
一个替换目录结构的正则表达式 实现目录的增加
javascript 基于正则表达式的文本框验证代码
php 正则表达式提取网页超级链接url的函数
ASP超级链接和HTML函数正则表达式 修正版
javascript 获取url参数的正则表达式(用来获取某个参数值)
PHP 正则表达式后面接的/isU, /is, /s含义
javascipt 正则表达式英文版

正则表达式 中的 asp只采集网站可见文本的正则


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-13   浏览: 94 ::
收藏到网摘: n/a

它可以过虑Js 可以过滤 CSS 过滤HTML标识,只采集页面的可见文本。
我写的是这样:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.IgnoreCase = True
reg.Global = True
reg.Pattern = "(<s+cript(.+?)<\/s+cript>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "(<s+tyle(.+?)<\/s+tyle>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "<[^>]*>"
originCode= reg.Replace(originCode, "")
ClearHTMLCode = originCode
End Function
不过有一些过滤不了!而且速度太慢!