当前位置: 首页 > 图文教程 > 网络编程 > PHP > DOMXML: Expat之外的另一选择

PHP
php 多线程上下文中安全写文件实现代码
PHP类的使用 实例代码讲解
用php实现让页面只能被百度gogole蜘蛛访问的方法
php 学习笔记
PHP编程过程中需要了解的this,self,parent的区别
php 操作excel文件的方法小结
使用PHP获取网络文件的实现代码
PHP 巧用数组降低程序的时间复杂度
php下将XML转换为数组
php 文件上传代码(限制jpg文件)
php 无极分类(递归)实现代码
PHP 采集获取指定网址的内容
PHP 将图片按创建时间进行分类存储的实现代码
PHP 存储文本换行实现方法
PHP 批量更新网页内容实现代码
用PHP查询搜索引擎排名位置的代码
用php实现的获取网页中的图片并保存到本地的代码
php实现首页链接查询 友情链接检查的代码
处理php自动反斜杠的函数代码
php实现的遍历文件夹下所有文件,编辑删除

PHP 中的 DOMXML: Expat之外的另一选择


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-11-03   浏览: 46 ::
收藏到网摘: n/a

概述

  在网上有许多php的XML教程,但是只有少数介绍如何使用DOM来解析XML。我想利用这个机会展示一下在PHP编程中除了广泛使用的SAX实现方式外,还有另一种选择。

  DOM(Document Object Model,文档对象模型)和SAX(Simple API for XML,XML简单应用程序接口)在如何解析XML上有不同的方法。SAX引擎完全是事件驱动的。当它遇到一个标记时,它就调用一个适当的函数来处理它。这使得SAX非常快速和有效。然而他给你的感觉就象被套在一个没完没了的循环里面。你发现自己使用了太多的全局变量和条件语句。

  另一方面,DOM方法稍稍对内存有些敏感。它把整个XML文档以层次化的结构方式装载到内存里。这就是说,所有的数据组成了一个家族树,它们对编程者来说都是可用的。这种方法更直观,更容易使用,也提供了更多的可读性。

  为了使用DOM函数,你必需在配置PHP时,使用'--with-dom'参数。它们不是标准配置的组成部分,这里有一个简单的编译方式。

%> ./configure --with-dom --with-apache=../apache_1.3.12
%> make
%> make install

  译注:在Win32平台上支持DOM做法是这样的。首先,将下载包中dlls目录下的php_domXML.dll文件复制到系统目录下。NT、Win2K是system32目录,9X是system目录。其次,修改php.ini文件。将"Paths and Directories"中的extension_dir参数指向php_domXML.dll所在的路径,如extension_dir = C:\Winnt\system32;将"Dynamic Extensions"中extension=php_domXML.dll前的注释去掉。

  DOM如何构造XML

  因为DOM装载一个完整的字符串或文件到内存中作为一个树,这使我们可以将这些数据作为一个整体进行操作。我们拿这个XML文档作为一个例子。

<?XML version="1.0"?>

<book type="paperback">
<title>Red Nails</title>
<price>$12.99</price>
<author>
<name first="Robert" middle="E" last="Howard"/>
<birthdate>9/21/1977</birthdate>
</author>
</book>

  数据将象这样被组织起来

DomNode book
|
|-->DomNode title
| |
| |-->DomNode text
|
|-->DomNode price
| |
| |-->DomNode text
|
|-->DomNode author
|
|-->DomNode name
|
|-->DomNode birthdate
|
|-->DomNode text

  任何被标记封闭起来的文本都是它们自身的节点。举个例子来说,"Red Nails"是title的子节点,"$12.99"是price的子节点。
 在DOM中使用的对象

  你可能会觉得困惑,什么是一个DomNode。我们从这里开始讨论包含在DOM模型中的对象。DOM定义了五种对象:DomDocument, DomNode, DomAttribute, DomDtd, 和 DomNamespace。我们将把主要注意力集中在DomDocument和DomNode对象,因为他们是最常用的。

  Node对象

  下面是一个DomNode对象所包含内容的概览。

class DomNode
 properties:
  name
  content
  type
 methods:
  lastchild()
  children()
  parent()
  new_child( $name,$content )
  getattr( $name )
  setattr( $name,$value )
  attributes()

  properties需要一些详细的说明。

  ·name 属性实际上是节点标记的名称。一个引用title标记的节点可能就是用'title'作为节点名。

  ·content 属性通常是空的。然而文本型节点使用这个属性来保存文本。

  ·type 属性是个常数,它明确定义了这个节点是什么类型的对象。有一些DomNode对象的类型。这些类型常数的列表可以从http://www.php.net/manual/ref.domXML.php在线获得。例如,一个包含文本内容的节点就可能有一个XML_TEXT_NODE的类型。

  methods也需要解释一下。