utf8和unicode编码究竟是什么关系？有何区别?- CSS样式表

当前位置: 首页 > 图文教程 > 网页制作 > CSS样式表 > utf8和unicode编码究竟是什么关系？有何区别?

CSS样式表: CSS的margin边界叠加深度剖析图文演示; CSS中Float（浮动）相关技巧文章; 惊现学习CSS应该注意的方法; 使用text-align:justify实现两端对齐一例; CSS整体布局声明的一些使用技巧; 推荐深入理解css中的position定位和z-index属性; 固定表格的高度超过指定高度就隐藏的方法; 推荐个Css的filter常用滤波器属性及语句大全; 用css滤镜实现的文字描边效果的代码; 用css实现的带阴影的表格效果的代码; 推荐个不错的表单Input的高级用法11例; flash幻灯片需要先激活ActiveX控件才能使用的又一个办法; DIV+CSS作网页容易犯的错误小结; ul+li及css制作韩国风格菜单代码; div布局的自由伸展三栏式版面的代码; 几乎被设计师遗忘了的标签fieldset legend; 不用javascript实现带序号的表格隔行换色的效果; 用CSS实现基本条状图表效果; 用javascript来控制链接的target 属性的代码; 多浏览器css兼容分析小结

No. « ‹ 41 42 43 44 › »

技术文章搜索

关键字

CSS样式表中的 utf8和unicode编码究竟是什么关系？有何区别?

出处:互联网 整理: 软晨网（RuanChen.com） 发布: 2009-09-12 浏览: 123 ::

收藏到网摘: n/a

解析IE, FireFox, Opera 浏览器支持Alpha透明的方法 XHTML下css+div布局总结超强推荐

UTF8 == Unicode Transformation Format -- 8 bit
是Unicode传送格式。即把Unicode文件转换成BYTE的传送流。
UTF8流的转换程序：
Input: unsigned integer c - the code point of the character to be encoded （输入一个unicode值）
Output: byte b1, b2,b3, b4 - the encoded sequence of bytes (输出四个BYTE值）
Algorithm（算法）:
if (c<0x80)
b1 = c>>0 & 0x7F | 0x00
b2 = null
b3 = null
b4 = null
else if (c<0x0800)
b1 = c>>6 & 0x1F | 0xC0
b2 = c>>0 & 0x3F | 0x80
b3 = null
b4 = null
else if (c<0x010000)
b1 = c>>12 & 0x0F | 0xE0
b2 = c>>6 & 0x3F | 0x80
b3 = c>>0 & 0x3F | 0x80
b4 = null
else if (c<0x110000)
b1 = c>>18 & 0x07 | 0xF0
b2 = c>>12 & 0x3F | 0x80
b3 = c>>6 & 0x3F | 0x80
b4 = c>>0 & 0x3F | 0x80
end if
=====================
unicode 是一种编码表格，例如，给一个汉字规定一个代码。类似 GB2312-1980, GB18030等，只不过字集不同。
=====================
一个unicode码可能转成长度为一个BYTE,或两个，三个，四个BYTE的UTF8码，取决于unicode码的值。英文unicode码因为值小于0x80,只要用一个BYTE的UTF8传送，比送unicode两个BYTEs快。
UTF8是为传送unicode而想出来的“再编码”方法罢了。
UTF8转unicode用我上面给的程序反算即可。
UTF8是现有ASCII系统转向Unicode系统的一个过渡解决方案。UTF8是保证 ASCII兼容性，再向大字符集方向扩展。这是Unicode推荐的方案。但是因为解决问题的角度不同，对现有的中文系统不是好的解决方案。一下连接提供了详细的 UTF8编码的初步知识 http://www.acnis.com/modules.php?name=ArticlE&file=article&sid=102 参考资料：http://www.acnis.com/modules.php?name=ArticlE&file=article&sid=102
什么是Unicode。Unicode的基本目标是统一所有的编码，即它包含所有的字符集。这样只要一个系统支持Unicode，那么，就能处理这些字符集。一般Unicode有两个字节。现在的windows操作系统都是支持Unicode的。
什么是UTF8呢？UTF8是一种Unicode编码，即它的编码的字符集和Unicode是一致的。但编码的方式不一样。对于英文字符来讲，UTF8的编码和一般的一样，用到一个字节。但对于中文来讲，那么要用三个字节表示（记忆中是三个）。
UTF8和Unicode的缺点是在处理查找、搜索等问题时，好像算法上比较复杂，效率不高（记忆中）。

解析IE, FireFox, Opera 浏览器支持Alpha透明的方法 XHTML下css+div布局总结超强推荐

CSS样式表 中的 utf8和unicode编码究竟是什么关系？有何区别?

评论 (0) All

CSS样式表中的 utf8和unicode编码究竟是什么关系？有何区别?