当前位置: 首页 > 图文教程 > 网络编程 > PHP > PHP 和 XML: 使用expat函数(二)

PHP
php 多线程上下文中安全写文件实现代码
PHP类的使用 实例代码讲解
用php实现让页面只能被百度gogole蜘蛛访问的方法
php 学习笔记
PHP编程过程中需要了解的this,self,parent的区别
php 操作excel文件的方法小结
使用PHP获取网络文件的实现代码
PHP 巧用数组降低程序的时间复杂度
php下将XML转换为数组
php 文件上传代码(限制jpg文件)
php 无极分类(递归)实现代码
PHP 采集获取指定网址的内容
PHP 将图片按创建时间进行分类存储的实现代码
PHP 存储文本换行实现方法
PHP 批量更新网页内容实现代码
用PHP查询搜索引擎排名位置的代码
用php实现的获取网页中的图片并保存到本地的代码
php实现首页链接查询 友情链接检查的代码
处理php自动反斜杠的函数代码
php实现的遍历文件夹下所有文件,编辑删除

PHP 和 XML: 使用expat函数(二)


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-08-14   浏览: 65 ::
收藏到网摘: n/a

让我们看一下实际处理这个文档的PHP代码。

以下为引用的内容:

/*NewsBoy : News system for the web written in PHP by Justin Grant (Web: jusgrant.cjb.net or justin.host.za.net Mail: [email protected])25 March V0.0.2 Converted Newsboy to a PHP class, allowing the layout to be easily modified. Also added made the HTML that is genrated a little easier to read.24 March V0.0.1 Just completed the intial version, very rough and basic.*/
class newsboy { var $xml_parser; var $xml_file; var $html; var $open_tag ; var $close_tag ;
//Class Constructor
function newsboy() { $this->xml_parser = ""; $this->xml_file = ""; $this->html = ""; $this->open_tag = array(
//these are the default settings but they are quite easy to modify
"NEWSBOY" => "nn", "STORY" => " ", "DATE" => "", "SLUG" => " ", "TEXT" => "", "PIC" => "", "NEWLINE" => "" ); $this->close_tag = array( "NEWSBOY" => "
nnn", "STORY" => "", "DATE" => "", "SLUG" => "
", "TEXT" => "n", "PIC" => " "
" ); }
//Class Destructor (has to be invoked manually as PHP does not support destructors)

function destroy() { xml_parser_free($this->xml_parser); }
//Class Members
function concat($str) { $this->html .= $str; }
function startElement($parser, $name, $attrs) { //global $open_tag; if ($format= $this->open_tag[$name]) { $this->html .= $format; } }
function endElement($parser, $name) { global $close_tag; if ($format= $this->close_tag[$name]) { $this->html .= $format; } }
function characterData($parser, $data) { $this->html .= $data; }
/* function PIHandler($parser, $target, $data) { //switch (strtolower($target)){ // case "php": eval($data); // break; //} }*/
function parse() { $this->xml_parser = xml_parser_create(); xml_set_object($this->xml_parser, &$this); // use case-folding so we are sure to find the tag in $map_array
xml_parser_set_option($this->xml_parser, XML_OPTION_CASE_FOLDING, true); xml_set_element_handler($this->xml_parser, "startElement", "endElement"); xml_set_character_data_handler($this->xml_parser, "characterData");//xml_set_processing_instruction_handler($this->xml_parser, "PIHandler");
if (!($fp = fopen($this->xml_file, "r"))) { die("could not open XML input"); } while ($data = fread($fp, 4096)) { if (!xml_parse($this->xml_parser, $data, feof($fp))) { die(sprintf("XML error: %s at line %d", xml_error_string(xml_get_error_code($this->xml_parser)), xml_get_current_line_number($this->xml_parser))); } } }}
?>

--------------------------------------------------------------------------------

在这个类的构造函数中,我创建了打开与关闭两个标记数组。数组的关键字与我后面将要分析的标记是
一样的,并且它们相应的值包含格式化打开与关闭标记的HTML代码。

我定义了一个简单的类析构函数用来当我们不再需要它时释放XML 分析器。这个函数不得不手工调用,
因为PHP不支持当一个对象释放时自动调用类的析构函数。

然后我定义了在XML文档中用来分析打开和关闭标记的主回调方法。我也定义了一个数据分析方法, 将
用于当打开和关闭标记中有数据时,对数据进行简单的格式化,后面我将向你演示如何将这些回调方法注册
到分析器中。

在startElement和closeElement(当分析到一个打开或关闭标专时被分别调用)中使用 标记的名字
作为索引键值对相应的数组进行查询。如果那个键值存在,则返回值并且追加到类的'html' 属性的后面。
'html'属性将在以后我们真正显示文档内容的时候使用。

characterData方法简单地将标记之间的值加到类的html属性的后面。

被注释起来的叫PIHandler的方法是一个回调函数,我还未曾实现它。如果它存在的话,它将直接在XML
文档中处理php脚本。

现在,让我解释一下主要的分析方法的调用,你猜一猜,parse()!!!

第一行调用了函数xml_parser_create(),它将返回一个expat的xml分析器的实例,并且被保存在类的
属性&this->xml_parser中。

下一步,我们需要用函数xml_set_object()来注册一个类方法的回调函数。

我是这样使用的,xml_set_object($this->xml_parser, &$this)。我在第一个参数中指定了用
来保存xml 分析器的类属性,然后在第二个参数,我指定了PHP对象的实例地址。这个可以让分析器 知道全
部将要注册的回调函数,是在那个地址上指定类的实际的方法。这就象c或c++中的一个'引用传递',也有人
简单地叫做'引用变量'。

在下一行,我调用了xml_parser_set_option()设置了一个xml分析器的属性,使用大小写折叠( case
folding)。大小写折叠只是告诉分析器知道,当我分析我的XML文档时我并不关心大小写敏感,但是 如果你
想使用大小写敏感来定义两个不同的标记,如或,你可以不设置它。

通过使用xml_set_element_handler(),我指定了用于开始和结束标记的回调函数,名字是
"startElement"和"endElement"。

接着,我使用xml_set_character_data_handler()来指定字符数据的处理句柄为名为
characterData()的回调函数。被注释的函数调用,xml_set_processing_instruction_handler(),
是一个我用于注册函数 PIHandler()的调用。PIHandler可以被包括在XML文档中处理php代码。

其它的代码只是很简单地读XML文件并且分析它。如果一个错误发生,那么错误明细将返回,包括错误
发生的行号。