汉字的区位码,内码是一回事吗

作者&投稿:虞裴 (若有异议请与网页底部的电邮联系)
汉字大的区位码是4376,它的机内码是多少?~

先将区位码每两位转十六进制
4376=2B4C(H)
机内码=区位码+A0A0(H)
2B4C+A0A0=CBEC(H)

国标码=区位码+2020h
(区位和位码分别由十进制转换为对应的十六进制后+2020h)
机内码=国标码+8080h
例:
“机”字的区位码为2790,
27d=1bh
90d=5ah
1b5ah+2020h=3b7ah
所以,国标码为3b7a
bbfah=33b7ah+8080h
所以,机内码为bbfah。

区位码:1980年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码。
内码:是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。比如MS Word中所存储和调用的就是内码而非图形文字。英文ASCII字符采用一个字节的内码表示,中文字符如国标字符集中,GB2312、GB12345、GB13000皆用双字节内码,GB18030(27,533汉字)双字节内码汉字为20,902个,其余6,631个汉字用四字节内码。

什么是国标码?什么是区位码?什么是内码?国标码、区位码、 内码 的关系?

1. 输入码

汉字的字数繁多,字形复杂,常用的汉字有6000—7000个,比英文的26个字母要多得多。在计算机系统中使用汉字,首先遇到的问题就是如何把汉字输入到计算机内。为了能直接使用西文标准键盘进行输入,必须为汉字设计相应的编码方法。汉字编码方法主要分为三类:数字编码、拼音编码和字形编码。

⑴数字编码

数字编码就是用数字串代表一个汉字的输入,常用的是国标区位码。国标区位码将国家标准局公布的的6763个两级汉字分成94个区,每个区定为94位,实际上是把汉字表示成二维表的形式,区码和位码各用两位十进制数字表示,因此,输入一个汉字需要按键四次。例如,“中”字位于第54区48位,区位码为5448。

汉字在区位码表的排列是有规律的。在94个分区中,1—15区用来表示字母、数字和符号,16—87区为一级和二级汉字。使用区位码方法输入汉字时,必须先在表中查找汉字并找出对应的代码,才能输入。数字编码输入的优点是无重码,而且输入码和内部编码的转换比较方便,但是每个编码都是等长的数字串,代码难以记忆。

⑵拼音编码

拼音编码是以汉语读音为基础的输入方法。由于汉字同音字太多,输入重码率很高,因此,按拼音输入后还必须进行同音字选择,影响了输入速度。

⑶字形编码

字形编码是以汉字的形状确定的编码。汉字总数虽多,但都是由一笔一划组成,全部汉字的部件和笔划是有限的。因此,把汉字的笔划部件用字母或数字进行编码,按笔划书写的顺序依次输入,就能表示一个汉字,五笔字型、表形码等便是这种编码法,这种方法得缺点也是需要记忆很多的编码。五笔字型编码是最有影响的字形编码方法之一。

2. 汉字国标交换码和机内码

西文处理系统的交换码和机内码均为ASCII,用一个字节表示,一般只用低七位。1981年我国在国标GB2312-80制定了汉字交换码也称为国标交换码(简称国标码)。在国标码中,一个汉字用两个字节表示,每个字节也只用其中的七位,每个字节的取值范围和94个可打印的ASCII字符的取值范围相同(21H-7EH),涵盖了一、二级汉字和符号。为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统一般都采用将国标码每个字节高位置“1”作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。区位码、国标码和机内码之间的关系可以概括为(区位码的十六进制表示) 2020H=国标码,国标码 8080H=机内码,以汉字“大”为例,“大”字的区内码为2083,将其转换为十六进制表示为1453H,加上2020H得到国标码3473H,再加上8080H得到机内码为B4F3H。

3. USC编码

为了统一地表示世界各国的文字,1993年中华人民共和国规定国家标准(简称为GB 13000)采用国际标准化组织公布的“通用多八位编码字符集”的国际标准ISO/IEC 10646,简称UCS(Universal Code Set)。UCS包含了中、日、韩等国的文字,这一标准为包括汉字在内的各种正在使用的文字规定了统一的编码方案。该标准是用四个字节来表示每一个字符,并相应地指定组、平面、行和字位。GB 13000规定的通用多八位编码字符集应被视为一个单一的实体。

整个编码字符集应被表达为包含128(一个字节的低七位即27=128)个组,其中每个组表示256(28=256)个平面。每一平面包含256行,每行有256个字位。四个字节共32位足以包容世界上所有的字符,同时也符合现代处理系统的体系结构。

第一个平面(00组中的00平面)称为基本多文种平面,它包含字母文字、音节文字及表意文字等。它分成四个区:

⑴A区:代码位置0000H—4DFFH(19903个字位)用于字母文字、音节文字及各种符号。

⑵I区:代码位置4E00H—9FFFH(20992个字位)用于中、日、韩(CJK)统一的表意文字。

⑶O区:代码位置A000H—DFFFH(16384个字位)留于未来标准化用。

⑷R区:代码位置E000H—FFFDH(8190个字位)作为基本多文种平面的限制使用区,它包括专用字符、兼容字符等各种符号。

如汉字的“大”国标码是3473H,在UCS的编码为00005927H,即在00组,00面,59H行,第27H字位上。

4. 汉字字形码

汉字字形码是表示汉字字形的字模数据,通常用点阵、矢量函数等方式表示,用点阵表示字形时,汉字字形码一般指确定汉字字形的点阵代码。字形码也称字模码,它是汉字的输出形式,随着汉字字形点阵和格式的不同,汉字字形码也不同。常用的字形点阵有16×16点阵、24×24点阵、48×48点阵等等。

字模点阵的信息量是很大的,占用存储空间也很大,以16×16点阵为例,每个汉字占用32(2×16=32)个字节,两级汉字大约占用256KB。因此,字模点阵只能用来构成“字库”,而不能用于机内存储。字库中存储了每个汉字的点阵代码,当显示输出时才检索字库,输出字模点阵得到字形。


汉字的区位码(1001),其机内码为?
如果汉字的区码和位码转换成十六进制后为1001,那么这个汉字的机内码=1001H+A0A0H=B0A1H,这个汉字为“啊”!

二级字库汉字区位码
还有一种方法:1)在windows的造字程序中选择gb2312字符集,在'编辑'菜单里选择调用,就会显示出所有的字符集了.可以通过输入代码选择你需要的汉字,这里的代码不是区位码,是计算机的汉字内码.2)汉字区位码与计算机内码的关系是:内码=(区码+0xA0)(位码+0xA0),比如'啊'字的区码是16(0x10),位码是01...

[急]汉字文的区位码是4636,则它的国标码和机内码分别是什么
区位码是4636,则它的国标码和机内码分别是什么 区位码的十六进制是:2E24H。国标码是:AEA4H。机内码是:CEC4H。这个汉字是:文。

汉字的内码是什么?
机内码。汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外...

请介绍汉字输入码(外码)、内码、汉字库的概念
(4)字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。编码的转换举例 汉字 区位码 16进制 国标码 机内码 文 4636 2E24H 4E44H CEC4H “文”的区位码为4636,区码和位码分别用16进制表示即为“2E24H”, 0010 1110 0010 ...

使用GB2312的操作系统中,设某汉字的区位码为3040D则机内码为???
从中间分开,转换为16进制。30是1E,40是28,所以是&H1E28 机内码 = 区位码+&HA0A0 1E28+A0A0=BEC8 两个16进制,正好是一个字节。区位码、国标码与机内码的转换关系 (1)区位码先转换成十六进制数表示 (2)(区位码的十六进制表示)+2020H=国标码;(3)国标码+8080H=机内码 某汉字...

一个汉字的区位码为机(2790)D,其机内码和国标码分别是多少
(1)区位码先转换成十六进制数表示 (2)(区位码的十六进制表示)+2020H=国标码; (3)国标码+8080H=机内码 举例:以汉字“大”为例,“大”字的区内码为2790 解:1、区号为27,位号为90 2、将区位号2083转换为十六进制表示为1B5AH 3、1B5AH+2020H=3B7AH,得到国标码3B7AH 4、...

在电子计算机内关于汉字的机内码介绍?
区号、位号都不超过94,所以这两个字节的最高位仍然是“0”。为了避免汉字区位与ASCII码无法区分,汉字在计算机内的保存采用了机内码,也称汉字的内码。目前占主导地位的汉字机内码是将区码和位码分别加上数AOH作为机内码。如“啊”字的区位码的十六进制表示为1001H,而“啊”字的机内码则为 BOAIH...

内码和外码分别是什么啊?
二、外码 外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是“外在的‘经过学习之后,可直接了解的编码形式(例如:文字或语音符号)中文输入法对汉字的编码即属外码。常见的中文外码有仓颉码、行列码、大易码、呒虾米码、注音码、拼音码。

机内码、区位码、国际码分别是什么意思?
十六进制)+2020H机内码=国际码+8080H 机内码、国际码是十六进制的,区位码是十进制的。一般换算全部用十六进制,不过特别注意:区位码从十进制转换为十六进制是两位两位分别转换的。如:某汉字的区位码是2534。则25D=19H,34D=22H 国际码=1922H+2020H=3952H 机内码=3952H+8080H=B9D2H ...

五寨县18548736220: 我们平时所说的汉字的ascii码是否就是汉字内码(GB系列)啊?? -
魏逄信泰: 不是汉字不是用ASCII码的汉字的编码分为输入码、国标码、机内码和字模码输入码就是输入汉字时候的编码,有区位码、音码、形码、音形码等.像拼音输入、五笔输入等等这些都是用的输入码.国标码GB2312是国家81年公布的标准.每个汉字在计算机内是唯一标识的,这个就是用机内码.输出时候一般用字模码,构成的字库,共屏幕显示或打印.

五寨县18548736220: 汉字的机内码,国际码,区位码 之间的转换关系 -
魏逄信泰: 首先一点汉字的区位码一般都是十进制的表示的,而机内码、国际码是十六进制的. 一般换算全部用十六进制,不过特别注意:区位码从十进制转换为十六进制是两位两位分别转换的.也就是如果要进行转换,就要将区位码分开高两位和低两位分别各自转换成十六进制,下面的例子会说明. 国际码=区位码(用上面的方法转为十六进制)+2020H 机内码=国际码+8080H比如:某汉字的区位码是2534.则25D=19H,34D=22H国际码=1922H+2020H=3942H机内码=3952H+8080H=B9D2H

五寨县18548736220: 11汉字的内码和外码有什么区别? -
魏逄信泰: 输入码:又称汉字外码,无论是区位码或国标码都不利于输入汉字,为方便汉字的输入而制定的汉字编码,称为汉字输入码.汉字输入码属于外码.不同的输入方法,形成了不同的汉字外码.常见的输入法有以下几类:按汉字的排列顺序形成的...

五寨县18548736220: 汉字机内码的介绍 -
魏逄信泰: 汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码.输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关.机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理.

五寨县18548736220: 区位码,汉字交换码和汉字机内码 -
魏逄信泰: 区位码: 1981年国家颁布了GB2312汉字标准共有6763个,其中一级3755,二级3008,还有682非汉字字符.并为每个字符规定了标准编码,便于在计算机内部相互转换. 作为GB2312标准只是定义了一张94*94的二维表.其中行为区号,列...

五寨县18548736220: 正确的是:1汉字机内码就是国际码2汉字区位码是国际码3正数二进制补码就是原码本身4所有4所有十进制小数都能准确的转换为有限位二进制小数 -
魏逄信泰:[答案] 正确的是:3、正数的二进制补码就是原码本身. 在计算机中用二进制进行算术运算时,负数是用补码表示的.而正数不需要用补码.

五寨县18548736220: 汉字的区位码 国际码 和机内码的关系和转换方法 -
魏逄信泰: 区位码是10进制的,而国标码和机内码是16进制的,首先要把2083转化成16进制. 就是把20除16取余得到14 如同10进制转化2进制 同样把83除二取余 最后把得到的数加2020是国标码 再加上8080是机内码

五寨县18548736220: 简述汉字区位码、国标码和机内码的区别和联系.汉字机内码每个字节均大于十六进制数的A0H,为什么? -
魏逄信泰: 输入码、区位码、国标码与机内码,这些字对每一位computer fan 来说,可能都不陌生,但其中的联系与区别,可能就不那么清楚了,(笔者作为一名中专电脑教师,经常遇到同学问类似的问题),下面就这问题讲述一下,以飨读者.我们知...

五寨县18548736220: 什么是汉字的内码、外码、交换码、字形码?
魏逄信泰: 1、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的.如ASCII.2、外码...

五寨县18548736220: 计算机中的内码是什么? -
魏逄信泰: 我们常说汉字的"内码"与"外码". 内码是汉字在计算机内部存储,处理和传输用的信息编码.它必须与ASCII码兼容但又不能冲突. 所以把国标码两个字节的最高位置'1',以区别于西文,这就是内码.汉字的输入码称为"外码".输入码即...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网