什么是Unicode

作者&投稿:骆汤 (若有异议请与网页底部的电邮联系)
Unicode字符是什么?~



对于英文来说,ascii码0-127就足以代码所有字符,对于中文而言,则必须使用两个字节(byte)来代表一个字符,具第一个字节必须大于127(所以我们有许程序判断中文都是以ascii码大于127作为条件)
以上用两个字节来表示一个中文的方式,在习惯上称为双字节(即DBCS:Double-ByteCharacterSet),而相对之下,英文的字符码就称为单字节SBCS(Single-ByteCharacterSet)。
虽然双字节(DBCS)足以解决中英文字符混合使用情况,但对于不同字符系统而言,必须经过字符码转换,非常麻烦。例如:中英文混合情况,日文,韩文等等。
为解决这个问题,Apple,Xerox,Microsoft,IBM,Novell,Borland...很多公司联合起来制订了一套可以适用于全世界所有国家的字符码,就称为Unicode
Unicode的特点是:
不管哪一国的字符码均以两个Byte表示,例如"A"在Unicode则是16进制41和00的组合,即4100,高位41(转换为Ascii码即是65=A),
WindowsNT/2000以Unicode来表示字符集,例如你可以看到MSSQLServer中产生的SQL文件可以选择是以Unicode来保存还是以普通格式来保存,如果你以Unicode保存,则在95/98平台许多软件均无法正确读出其格式。
同时你还可以注意到95/98中API定义,许多名称结尾是有一个A的,例如
WriteProfileStringA
而在NT/2000操作系统中,提供了两套API,另外一个命令是WriteProfileStringW,以W结尾的API只适用于NT/2000。(在NT中使用以W结尾的API函数效率比A结尾的要快,因为省去了Unicode和DBCS/SBCS的转换过程)

这样我们经常要用到的判断字符串长度的函数,在NT和95/98下执行结果不同,如下:(下面代码适合于VB,ASP)

95/98中:
len("abc中国")返回7(因为每个中文作为两个Ascii码来看)

nt/2000中:
len("abc中国")返回5(因为每个字符都作为一个Unicode来看)

明天将介绍如何在VB/NT环境下使len("abc中国")返回长度等于7

(PB不存在以上情况,除非你在NT下使用PB的Unicode版本,通常我们大家使用的均是PB的Windows32位版本)

对于英文来说,ascii码 0-127就足以代码所有字符,对于中文而言,则必须使用两个字节(byte)来代表一个字符,具第一个字节必须大于127(所以我们有许程序判断中文都是以ascii码大于127作为条件)
以上用两个字节来表示一个中文的方式,在习惯上称为双字节(即DBCS: Double-Byte Character Set),而相对之下,英文的字符码就称为单字节SBCS(Single-Byte Character Set)。
虽然双字节(DBCS)足以解决中英文字符混合使用情况,但对于不同字符系统而言,必须经过字符码转换,非常麻烦。例如:中英文混合情况,日文,韩文等等。
为解决这个问题,Apple, Xerox, Microsoft, IBM, Novell, Borland...很多公司联合起来制订了一套可以适用于全世界所有国家的字符码,就称为Unicode

对于英文来说,ascii码0-127就足以代码所有字符,对于中文而言,则必须使用两个字节(byte)来代表一个字符,具第一个字节必须大于127(所以我们有许程序判断中文都是以ascii码大于127作为条件)
以上用两个字节来表示一个中文的方式,在习惯上称为双字节(即DBCS:Double-ByteCharacterSet),而相对之下,英文的字符码就称为单字节SBCS(Single-ByteCharacterSet)。
虽然双字节(DBCS)足以解决中英文字符混合使用情况,但对于不同字符系统而言,必须经过字符码转换,非常麻烦。例如:中英文混合情况,日文,韩文等等。
为解决这个问题,Apple,Xerox,Microsoft,IBM,Novell,Borland...很多公司联合起来制订了一套可以适用于全世界所有国家的字符码,就称为Unicode
Unicode的特点是:
不管哪一国的字符码均以两个Byte表示,例如"A"在Unicode则是16进制41和00的组合,即4100,高位41(转换为Ascii码即是65=A),
WindowsNT/2000以Unicode来表示字符集,例如你可以看到MSSQLServer中产生的SQL文件可以选择是以Unicode来保存还是以普通格式来保存,如果你以Unicode保存,则在95/98平台许多软件均无法正确读出其格式。
同时你还可以注意到95/98中API定义,许多名称结尾是有一个A的,例如
WriteProfileStringA
而在NT/2000操作系统中,提供了两套API,另外一个命令是WriteProfileStringW,以W结尾的API只适用于NT/2000。(在NT中使用以W结尾的API函数效率比A结尾的要快,因为省去了Unicode和DBCS/SBCS的转换过程)

这样我们经常要用到的判断字符串长度的函数,在NT和95/98下执行结果不同,如下:(下面代码适合于VB,ASP)

95/98中:
len("abc中国")返回7(因为每个中文作为两个Ascii码来看)

nt/2000中:
len("abc中国")返回5(因为每个字符都作为一个Unicode来看)

明天将介绍如何在VB/NT环境下使len("abc中国")返回长度等于7

(PB不存在以上情况,除非你在NT下使用PB的Unicode版本,通常我们大家使用的均是PB的Windows32位版本)

相关学习视频:

Unicode字符集




unicode是什么-
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。目前的Unicode字符分为17组编排,0x0000 至 0x10FFFF,每组称为平面(Plane),而每平面拥有65536个码位,共1114112个。然而目前只用了少数平面。UTF-8、UTF-16、UTF-32都是将数字转换到程序数据的编码方案。

Unicode是什么???
Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。Unicode通常...

什么是UNICODE
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。Unicode用数字0-0x10FFFF来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位。码位就是可以分配给字符的数字。UTF-8、UTF-16、UTF-32都是将数字转换到程序数据的编码方案。Unicode字符集可以简写为UCS(Unicode Charact...

Unicode是什么_unicode是什么格式的文件
Unicode也就是统一码。统一码,也叫万国码、单一码(Unicode)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,19...

什么是Unicode?
Unicode是一种字符编码方案,它为每种语言中的每个字符都设定了统一唯一的二进制编码,以实现跨语言、跨平台进行文本转换、处理的要求。Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。目前的Unicode字符分为17组编排,0x0000至0x10FFFF,每组称为平面(Plane),而每平面拥有65536个码...

unicode是什么???
Unicode是一种字符编码标准,它为全球范围内的文本提供了一个统一的编码方式。这意味着无论使用哪种计算机或软件程序,只要遵循Unicode标准,就能正确地显示和识别各种语言的字符。Unicode的详细解释如下:1. 基本概念 Unicode是一种计算机用的字符集,它不仅涵盖了大多数国家使用的文字符号,还包括许多其他...

通俗的讲,什么是unicode?
最新版本的 Unicode 是 2006年7月14日推出的Unicode 5.0.0。Unicode 的编码方式与 ISO 10646 的通用字符集对应,使用16位的编码空间,每个字符占用2个字节。理论上最多可以表示65536 个字符。基本满足各种语言的使用。实际上目前版本的 Unicode 尚未填充满这16位编码,保留了大量空间作为特殊使用或将来...

Unicode 是什么意思?
Unicode 是一种字符编码标准,用于表示文本中的所有字符。在计算机系统中,数据以二进制形式存储和处理。因此,为了能够正确地处理各种语言的字符,我们需要一套统一的编码标准。Unicode 为世界各地使用的所有字符提供了一个标准编码方式,它包含了超过 13 万个字符的编码方案。Unicode 的作用是保证在任何...

什么是UniCode
就是将世界上所有的文字用2个字节统一进行编码。那样,像这样统一编码,2个字节就已经足够容纳世界上所有的语言的大部分文字了。Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。现在用的是UCS-2,即2个字节编码,而UCS-4是为了防止将来2个字节不够用才开发的。

unicode是什么意思
Unicode是一种计算机通用的字符编码标准,它定义了文本字符在计算机中的表示方式。这个编码标准最初的设计目的是解决不同国家和地区之间的字符编码不一致的问题,从而实现全球范围内的文本互通。Unicode的出现,使得不同语言和文化的文本可以在同一平台上进行显示和处理。下面是关于Unicode的 1. 基本概念:在...

山阳区15065635394: 通俗的讲,什么是unicode? -
直丽阿尔: 通俗、简单地说,Unicode是一种计算机的字符编码,通过它统一、唯一的编码规则,可以在计算机上表示出不同国家的文字和字符,它所涵盖的字符集,称为Unicode字符集.

山阳区15065635394: 什么是unicode编码 -
直丽阿尔: Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案.被译为万国码、统一码或单一码.能够使计算机实现跨语言、跨平台的文本转换及处理.Unicode用数字0-0x10FFFF来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位.码位就是可以分配给字符的数字.

山阳区15065635394: unicode是什么意思?是干什么的? -
直丽阿尔: Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码.Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求.百科上有详细的解释

山阳区15065635394: unicode什么意思 -
直丽阿尔: 一种编码方式,主要用于显示中,日,韩文.最早用的是ASKII,这个是美国人的,主要针对它们的拼音文字.8位,只能显示128个字符.而中文则要16位,为了解决这个问题,提出了Unicode编码.

山阳区15065635394: 什么是 Unicode?
直丽阿尔: unicode Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码.它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求.1990年开始研发,1994年正式公布.随着计算机工作能力的增强,Unicode也在面世以来的十多年里得到普及.

山阳区15065635394: 到底什么是unicode 编码? -
直丽阿尔: 这些东西没用过,或者他们根本就不是unicode-16,而是UTF-8unicode很容易和ASCII兼容,ASCII前面加1个等于0的字节就是unicode字符了.unicode并没有全部汉字都收录,而且是中文日文韩文中某些字是差不多的. 最后中文日文韩文加起来就1万多字符. 所以2字节就几乎收录了世界上大部分的常用文字和符号.他还可以扩充到32字节,用以表示更多字符. 第一个字节用特殊值作标记位,他告诉解析器,这个字节和后面三个应该当成一个字符处理.这样他就可以表示160多万字符.

山阳区15065635394: 什么是Unicode字符? -
直丽阿尔: Unicode 是一种重要的交互和显示的通用字符编码标准,它覆盖了美国、欧洲、中东、非洲、印度、亚洲和太平洋的语言,以及古文和专业符号.Unicode 允许交换、处理和显示多语言文本以及公用的专业和数学符号.它希望能够解决多语言的计算,如不同国家的字符标准,但并不是所有的现代或古文都能够获得支持.

山阳区15065635394: unicode是什么,unicode编码,unicode字符 -
直丽阿尔: Unicode指国际标准万国码(又称统一码、单一码),对全球语言文字中的每个字符设定了唯一的二进制编码,实现跨语言、跨平台的文本交换.这是计算机领域的一项公认业界标准,包括字符集和编码方案等.从1994年正式公布首版以来,不...

山阳区15065635394: 什么是Unicode文件
直丽阿尔: Unicode文件名其实就是指一些软件,在保存文件时要求使用者选择保存为Unicode格式的文件名称,因为对于一些非Win32的操作系统,比如Linux系统,在识别像中日韩文这样的双字节文件名时会出现乱码的情况,Unicode为这种问题提供了一种全球化的解决方案.

山阳区15065635394: unicode文档是什么 -
直丽阿尔: Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS. 现在用的是UCS-2,即2个字节编码,而UCS-4是为了防止将来2个字节不够用才开发的.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网