版本1和2间的区别
于2011-07-19 05:14:59修订的的版本1
大小: 785
编辑: 202
备注:
于2016-03-09 09:08:10修订的的版本2
大小: 873
编辑: 183
备注:
删除的内容标记成这样。 加入的内容标记成这样。
行号 10: 行号 10:

UTF-16根据每个码字两个字节的存储顺序分为[[UTF-16LE]]和[[UTF-16BE]]

UTF-16


UTF-16Unicode的其中一个使用方式。 UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。

它定义于ISO/IEC 10646-1的附录Q,而RFC2781也定义了相似的做法。

在Unicode基本多文种平面定义的字符(无论是拉丁字母汉字或其他文字符号),一律使用2字节储存。而在辅助平面定义的字符,会以代理对(surrogate pair)的形式,以两个2字节的值来储存。

UTF-16比起UTF-8,好处在于大部分字符都以固定长度的字节 (2字节) 储存,但UTF-16却无法兼容于ASCII编码c#中默认的就是UTF-16,所以在处理c#字符串的时候只能是byte,stream等方式去处理

UTF-16根据每个码字两个字节的存储顺序分为UTF-16LEUTF-16BE

UTF-16 (2016-03-09 09:10:13由183编辑)