当前位置: 首页 > 图文教程 > 网络编程 > 相关技巧 > 文本文件编码方式区别

相关技巧
zend studio 快捷键收集
写给正在读计算机专业的同学 该如何学习
使用HTTP_X_FORWARDED_FOR获取客户端IP的严重后果
HTTP请求 GET与POST方法的区别
web服务器程序运行出现乱码问题的解决方法

相关技巧 中的 文本文件编码方式区别


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2010-01-10   浏览: 161 ::
收藏到网摘: n/a

当一个软件打开一个文本时,它要做的第一件事是决定这个文本究竟是使用哪种字符集的哪种编码保存的。 软件一般采用三种方式来决定文本的字符集和编码:
检测文件头标识,提示用户选择,根据一定的规则猜测
最标准的途径是检测文本最开头的几个字节,开头字节Charset/encoding,如下表:
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.