当前位置: 首页 > 图文教程 > 网络编程 > PHP > 单汉字转UNICODE

PHP
PHP Tokenizer 学习笔记
三步搞定phpwind的静态化部署
DEDE5.3把tag标签逗号改成空格的方法分享
实例解析:从IIS的ASP迁移到APACHE的PHP
PHP读取Excel 之 Spreadsheet_Excel_Reader
PHP导出Excel 之 Spreadsheet_Excel_Writer
PDO不推广,PHP得不到发展
勇于创新,激情开拓新的未来
PHPCMS开发文档里看到PHP编码规范
一个模版引擎的诞生 开发者的思考
关于PHP开发框架
开发框架的选择和设计经验谈
框架带给我们什么(浅谈PHP框架对PHP发展的影响)
通过PHP实现DataGrid功能
php curl函数应用方法之模拟浏览器
单汉字转UNICODE
php在线打包/解包
listdir($dir) 目录读取函数
使用Apache的rewrite技术
php正则

PHP 中的 单汉字转UNICODE


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-08-19   浏览: 874 ::
收藏到网摘: n/a

  1. /**  
  2.  * 把一个汉字转为unicode的通用函数,不依赖任何库,和别的自定义函数,但有条件  
  3.  * 条件:本文件以及函数的输入参数应该用utf-8编码,不然要加函数转换  
  4.  * 其实亦可轻易编写反向转换的函数,甚至不局限于汉字,奇怪为什么php没有现成函数  
  5.  * @author xieye  
  6.  *  
  7.  * @param {string} $word 必须是一个汉字,或代表汉字的一个数组(用str_split切割过)  
  8.  * @return {string} 一个十进制unicode码,如4f60,代表汉字 “你”  
  9.  */  
  10. function getUnicodeFromOneUTF8($word) {   
  11.   //获取其字符的内部数组表示,所以本文件应用utf-8编码!   
  12.   if (is_array$word))   
  13.     $arr = $word;   
  14.   else  
  15.     $arr = str_split($word);   
  16.   //此时,$arr应类似array(228, 189, 160)   
  17.   //定义一个空字符串存储   
  18.   $bin_str = '';   
  19.   //转成数字再转成二进制字符串,最后联合起来。   
  20.   foreach ($arr as $value)   
  21.     $bin_str .= decbin(ord($value));   
  22.   //此时,$bin_str应类似111001001011110110100000,如果是汉字"你"   
  23.   //正则截取   
  24.   $bin_str = preg_replace('/^.{4}(.{4}).{2}(.{6}).{2}(.{6})$/','$1$2$3'$bin_str);   
  25.   //此时, $bin_str应类似0100111101100000,如果是汉字"你"   
  26.   return bindec($bin_str); //返回类似20320, 汉字"你"   
  27.   //return dechex(bindec($bin_str)); //如想返回十六进制4f60,用这句