当前位置: 首页 > 图文教程 > 网络编程 > Javascript > 利用 PHP 将 HTML 转化为 WML

Javascript
动态生成select选项全接触
不刷新页面动态更新select选项,实现两个select相互操作
网页输入框日期型有效性判定一网打尽
实用Javascript函数之一(自动将输入文本框中的内容转换成大写字符)
实用Javascript函数之二(自动将输入文本框中的内容转换成小写字符)
实用Javascript函数之三(限制文本输入框中只能输入数字\"0\"到\"9\")
实用Javascript函数之四(用于对sString字符串进行前空格截除)
实用Javascript函数之五(用于对sString字符串进行后空格截除)
实用Javascript函数之六(截除字符串前后空格)
如何使用交替的滚动标题
采用DOM模型时创建一个Select节点后,要删除option项的解决方法
javascript函数速查
利用JavaScript和正则表达式进行丰富的日期判断(给其它项目组的代码,有比较好的编程风格和注释)
关于字符串的几个有用函数
FileSystemObject 的例子(处理驱动器、文件夹、文件)
用JScript实现VB.Net,C#的[委托Delegate]:
得到固定字符位置的函数
IE NC通用的藏鼠标右键一法
Menu
foolpot2001菜单

Javascript 中的 利用 PHP 将 HTML 转化为 WML


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-08-10   浏览: 159 ::
收藏到网摘: n/a

WML,WAP,PHP,HTML

最近在做学校的 WAP 网站,其中通知公告、新闻等信息来源于原来的学校网站上的信息,因此就涉及到一个 HTML 转化为 WML 的问题。尽管现在的 WAP 2.0 支持 XHTML 的内容显示,但是 XHTML 语法要求比 HTML 严格,我们来源信息的 HTML 内容并不能保证符合 XHTML 的要求,而且 XHTML 相对于 WML 来说,内容的流量还是相对比较多一些的,另外仅支持 WAP 1.x 的手机设备也不支持 XHTML,因此为了支持更多的手机设备用户能够正常的浏览我们 WAP 网站,我们采用了 WML,而不是 XHTML。

对于新闻、通知、公告之类的信息,对手机设备用户来说,最关心的是文字内容,因此我们的主要工作就是按照一定的格式(比如该换行分段的地方要换行分段)来从原来的 HTML 页面里提取出纯文本信息,并将其转化为 WML。下面的代码演示了如何来实现这个步骤:

PHP代码:
<?php
       
    
/**
    * @author 马秉尧
    * @copyright 2005 CoolCode.CN
    */
       
    
function text2wml($content) {
        
// 将 WML 变量前缀"$"转义
       
$content = str_replace('$', '$$', $content);
       
// 转换特殊字符,并将 Windows/DOS 换行符(\r\n)转化为 Unix 换行符(\n)
       
$content = str_replace("\r\n", "\n", htmlspecialchars($content));
       
// 通过换行符来将各行分开进行处理(过滤空行)
       
$content = explode("\n", $content);
       for (
$i = 0; $i < count($content); $i++) {
           
// 过滤首尾空格
           
$content[$i] = trim($content[$i]);
           
// 如果去掉全角空格为空行,则设为空行,否则不对全角空格过滤。
           
if (str_replace(" ", "", $content[$i]) == "") $content[$i] = "";
       }
       
//合并各行,转化为 WML,并过滤掉空行
       
$content = str_replace("<p><br /></p>\n", "", "<p>".implode("<br /></p>\n<p>", $content)."<br /></p>\n");
       return
$content;
   }
      
   function
html2wml($content) {
       
// 过滤掉样式表和脚本
       
$content = preg_replace("/<style .*?<\/style>/is", "", $content);
       
$content = preg_replace("/<script .*?<\/script>/is", "", $content);
       
// 首先将各种可以引起换行的标签(如<br />、<p> 之类)替换成换行符"\n"
       
$content = preg_replace("/<br \s*\/?\/>/i", "\n", $content);
       
$content = preg_replace("/<\/?p>/i", "\n", $content);
       
$content = preg_replace("/<\/?td>/i", "\n", $content);
       
$content = preg_replace("/<\/?div>/i", "\n", $content);
       
$content = preg_replace("/<\/?blockquote>/i", "\n", $content);
       
$content = preg_replace("/<\/?li>/i", "\n", $content);
       
// 将"&nbsp;"替换为空格
       
$content = preg_replace("/\&nbsp\;/i", " ", $content);
       
// 某些不规范的网页中可能有"&nbsp",在普通网页中显示会按照"&nbsp;"显示,不会引起错误,但是在 WAP 中会原样显示,因此也要替换成空格。
       
$content = preg_replace("/\&nbsp/i", " ", $content);
       
// 过滤掉剩下的 HTML 标签
       
$content = strip_tags($content);
       
// 将 HTML 中的实体(entity)转化为它所对应的字符(WML 仅支持很有现的几个 entity),这里我转化的是中文网页,因此我指定了"GB2312"编码。
       
$content = html_entity_decode($content, ENT_QUOTES, "GB2312");
       
// 过滤掉不能转化的实体(entity)
       
$content = preg_replace("/\&\#.*?\;/i", "", $content);
      
       
// 上面是将 HTML 网页内容转化为带换行的纯文本,下面是将这些纯文本转化为 WML。
       
return text2wml($content);
   }
   
?>