当前位置: 首页 > 图文教程 > 网络编程 > PHP > php UTF8 文件的签名问题

PHP
网站开发者参考:开源PHP网站源码
PHP教程:PHP开发网站代码编写规范
PHP教程:WebService最常用的两种方法
PHP通过SQL语句将数据写入MySQL数据库指定的表
PHP教程:修改discuz兼容自己开发的通行证
PHP教程:strlen与mb_strlen字符串长度函数
Apache的mod_rewrite模块拒绝盗链
windows 2003虚拟主机用httpd.ini控制盗链
PHP6的核心是对Unicode的内置支持
提高系统性能用eAccelerator优化PHP
10个开源的PHP网站内容管理系统
php中3des加密(完全与.net中的兼容)
PHP教程:时间函数
PHP教程:UCenter的MVC架构
PHP教程:PHP解析HTML字符串的问题
PHP教程:PHP截取HTML代码串问题
PhpSecInfo列出PHP环境设定中存在的安全问题
PHP教程:preg_replace_callback()函数
Google网站管理员工具的验证问题
解决PHP相对目录问题最有效的办法

PHP 中的 php UTF8 文件的签名问题


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2010-01-10   浏览: 115 ::
收藏到网摘: n/a

在我们保存UTF8文本文件的时候,可以选择带签名,或者不带签名。 也就是 有BOM 格式编码,或者 无BOM格式编码。
如果看文件的内容,是看不出任何差别的,以下列文件(schema.sqlite.sql)内容为例:
schema.sqlite.sql
复制代码 代码如下:

CREATE TABLE guestbook (
id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,
email VARCHAR(32) NOT NULL DEFAULT '[email protected]',
comment TEXT NULL,
created DATETIME NOT NULL
);
CREATE INDEX "id" ON "guestbook" ("id");

如果不带签名,则文件的大小为232字节,如果带签名,则文件大小为235字节。
UTF8签名有3个字节(内容为:EFBBBF),是专门用来告诉软件:该文件是UTF8编码的。
在一般情况下,有无签名不会带来问题,因为编辑器或者其他软件可以按照文本的内容来推断出是否是UTF8。
但有些时候还是会导致问题,比如上诉文件。该文件是sql语句文件,程序恰好要通过以下语句(php)来执行该sql:
复制代码 代码如下:

$schemaSql = file_get_contents(dirname(__FILE__) . '/schema.sqlite.sql');
$dbAdapter->getConnection()->exec($schemaSql);

在这种情况下,带有签名的文件就会导致问题了,因为“UTF8签名用的三个字节”其实是位于文件的最前面。所以导致了上面的语句无法成功运行。
解决的办法也很简单,去掉该文件UTF8签名即可。
当然,上面文件的内容其实都是单字节的,是没有必要保存为UTF8编码的。
补充:全部是单字节内容的文件除非加了UTF8签名,不然再次打开文件时,还是系统的默认编码而已。