当前位置: 首页 > 图文教程 > 网络编程 > PHP > php UTF8 文件的签名问题

PHP
php中如何避免sql注入攻击
半个汉字变问号,求解决办法
如何利用php来截取一段中文字符串而不出现乱码
php中文汉字替换与模式匹配的问题
如何生成静态html
提供一个最简单的购物车
如何用php作linux自动执行脚本?
phpsocket技术研究
PHP FRAMEWORK
如何将php作为shell脚本语言使用
用php实现pop3邮件的收取
浅析php中实现多线程
新身份证校验位算法
页面压缩gzip的运用
使cookie实现跨域名
PHP 验证码登陆校验
php中的面向对象和面向过程
php套接字编程
基于php的聊天室编程思想
实例学习php之投票程序

PHP 中的 php UTF8 文件的签名问题


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2010-01-10   浏览: 69 ::
收藏到网摘: n/a

在我们保存UTF8文本文件的时候,可以选择带签名,或者不带签名。 也就是 有BOM 格式编码,或者 无BOM格式编码。
如果看文件的内容,是看不出任何差别的,以下列文件(schema.sqlite.sql)内容为例:
schema.sqlite.sql
复制代码 代码如下:

CREATE TABLE guestbook (
id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,
email VARCHAR(32) NOT NULL DEFAULT '[email protected]',
comment TEXT NULL,
created DATETIME NOT NULL
);
CREATE INDEX "id" ON "guestbook" ("id");

如果不带签名,则文件的大小为232字节,如果带签名,则文件大小为235字节。
UTF8签名有3个字节(内容为:EFBBBF),是专门用来告诉软件:该文件是UTF8编码的。
在一般情况下,有无签名不会带来问题,因为编辑器或者其他软件可以按照文本的内容来推断出是否是UTF8。
但有些时候还是会导致问题,比如上诉文件。该文件是sql语句文件,程序恰好要通过以下语句(php)来执行该sql:
复制代码 代码如下:

$schemaSql = file_get_contents(dirname(__FILE__) . '/schema.sqlite.sql');
$dbAdapter->getConnection()->exec($schemaSql);

在这种情况下,带有签名的文件就会导致问题了,因为“UTF8签名用的三个字节”其实是位于文件的最前面。所以导致了上面的语句无法成功运行。
解决的办法也很简单,去掉该文件UTF8签名即可。
当然,上面文件的内容其实都是单字节的,是没有必要保存为UTF8编码的。
补充:全部是单字节内容的文件除非加了UTF8签名,不然再次打开文件时,还是系统的默认编码而已。