当前位置: 首页 > 图文教程 > 网络编程 > 正则表达式 > asp只采集网站可见文本的正则

正则表达式
过滤所有HTML代码和CSS,JS
正则表达式的语法
JScript 和 VBScript 正则表达式
ASP.NET 中的正则表达式
我的正则
正则表达式,提取网页中的链接地址
如何删除文本框里的文字内容中段落之间多余的分行
完美替换html代码
限制文本框中只能输入实数或整数,其它字符无效,有劳大家了!
<meta>正则
正则表达式中使用变量赋值
一个正则的写法 php
正则表达式基础
正则表达式学习笔记
如何用正则取input type="text"中的value
[原创]通过脚本清空标签p中的class名和style
[原创]VBS中的正则表达式的用法大全
正则表达式的使用 ASP
去html代码的正则 推荐
正则表达式的应用

正则表达式 中的 asp只采集网站可见文本的正则


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-13   浏览: 92 ::
收藏到网摘: n/a

它可以过虑Js 可以过滤 CSS 过滤HTML标识,只采集页面的可见文本。
我写的是这样:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.IgnoreCase = True
reg.Global = True
reg.Pattern = "(<s+cript(.+?)<\/s+cript>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "(<s+tyle(.+?)<\/s+tyle>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "<[^>]*>"
originCode= reg.Replace(originCode, "")
ClearHTMLCode = originCode
End Function
不过有一些过滤不了!而且速度太慢!