国 标 GB2312–80 中,"国" 字的十六进制编码为397A,其对应的汉字机内码为(

作者&投稿:冀咏 (若有异议请与网页底部的电邮联系)
国 标 GB2312–80 中,"国" 字的十六进制编码为397A,其对应的汉字机内码为(~

3 9 7 A
+ 8 0 8 0
-----------------------
11 9 15 A
-----------------------
B 9 F A

结论是,国字的机内码为:B9 FA

机内码
国标码:是指我国1981年公布的“中华人民共和国国家标准信息交换汉字编码”,代号为“GB2312-80”。由连续的两个字节组成。

2.机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码

3.输入码:汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。

4.字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。

(1)区位码先转换成十六进制数表示
(2)(区位码的十六进制表示)+2020H=国标码;
(3)国标码+8080H=机内码

汉字的机内码是指在计算机中表示一个汉字的编码。机内码与区位码稍有区别。汉字区位码的区码和位码的取值均在1~94之间,如直接用区位码作为机内码,就会与基本ASCII码混淆。为了避免机内码与基本ASCII码的冲突,需要避开基本ASCII码中的控制码(00H~1FH),还需与基本ASCII码中的字符相区别。为了实现这两点,可以先在区码和位码分别加上20H,在此基础上再加80H(此处“H”表示前两位数字为十六进制数)。经过这些处理,用机内码表示一个汉字需要占两个字节,分别 称为高位字节和低位字节,这两位字节的机内码按如下规则表示:
高位字节=区码+20H+80H(或区码+A0H)
低位字节=位码+20H+80H(或位码+AOH)
由于汉字的区码与位码的取值范围的十六进制数均为01H~5EH(即十进制的01~94),所以汉字的高位字节与低位字节的取值范围则为A1H~FEH(即十进制的161~254)。
例如,汉字“啊”的区位码为1601,区码和位码分别用十六进制表示即为1001H,它的机内码的高位字节为B0H,低位字节为A1H,机内码就是B0A1H。



2603 = 1A03H 区位码

+ A0A0H

= BAA3H 机内码

汉字的编码知识
信息编码各国有各国不同的编码,国际上统一使用的编码为ASCII(美国标准信息交换代码),我国使用的有国标码BG(中文),和BIG5(中文繁体)两种。

附带要知道:中文字库(字库文件名,大小,扩展名,存放位置)
中文输入方法(语音输入,键盘输入,手写输入,扫描输入等)



1.汉字的编码


(1)国标码:是指我国1980年公布的“信息交换汉字编码字符集”,代号为“GB2312-80”。由连续的两个字节组成。


(2)机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码。

(3)输入码:汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。


(4)字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。


编码的转换举例
汉字 区位码 16进制 国标码 机内码
文 4636 2E24H 4E44H CEC4H


“文”的区位码为4636,区码和位码分别用16进制表示即为“2E24H”, 0010 1110 0010 0100转换成国标码“4E44H”,0100 1110 0100 0100机内码为“CEC4H”, 1100 1110 1100 0100


2.汉字的输入方法


汉字输入方法目前有两大类四种。


(1)键盘输入法。这是最常用的,利用各种汉字输入方法的编码敲击键盘来输入汉字;


(2)非键盘输入法。目前主要有三种方法。


手写笔输入法:利用汉字识别技术,通过书写笔在感应板上书写汉字把其输入的方法。

语音输入法:利用语音识别技术,通过口说来输入汉字。


扫描识别输入,是将印或写在纸上的汉字通过扫描仪输入计算机,再经相应软件处理后转换成汉字机内码。


3.汉字字符集的概念


有两种汉字字符集。


(1)国标码字符集GB2312-80:该字符集收录了6763个常用汉字,其中一级汉字3755个,二级汉字3008个。另外还收录了各种符号682个,合计7445个。


(2)GBK汉字集:GBK即汉字扩充内码规范,又称大字符集,一共收录了20900个汉字。在Windows简体中文版中,又增加了101个补充字,一共有21001个字。它包容了GB2312-80的6763个常用汉字,台湾BIG5码收录了13000多个汉字,是目前见到的收录汉字最多的汉字系统

机内码和国标码都占两字节,而机内码和国标码的区别在于机内码的每个字节的最高位是1,而国标码的每个字节的最高位为0.
"国" 字的十六进制编码为397A,那么其机内码就为397AH+8080H=B9FA

汉字在计算机内部其内码是唯一的。因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。
国标码的机内码为二字节长的代码,它是在相应国标码的每个字节最高位上加“1”,即
汉字机内码=汉字国标码+8080H
例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。
汉字机内码的基础是汉字国标码。
机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。
汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加2020H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。
举例:机内码位BEDF,求区位码?
有两种解法:1.BEDFH-A0A0H=1E3FH=3063D;
2.BEDFH-8080H=3E5FH(国标码),3E5FH-2020H=1E3FH=3063D.

国标GB2312–80中,"国" 字的十六进制编码为397A,其对应的汉字机内码为( )
正如你所写,规则是:
机内码=国标码+8080H。
实际上,很简单,就是将对应的第15位和第7位置1即可。
3的十六进制码是0011,最高位置1,即变为1011,用十六进制表达就是B。
7的十六进制码是0111,最高位置1,即变为1111,用十六进制表达就是F。
所以,机内码就等于B9FA。


宾阳县15980838833: 国 标 GB2312–80 中,"国" 字的十六进制编码为397A,其对应的汉字机内码为( -
归贤更昔: 3 9 7 A + 8 0 8 0 ----------------------- 11 9 15 A ----------------------- B 9 F A结论是,国字的机内码为:B9 FA

宾阳县15980838833: 根据汉字国标码GB2312 - 80的规定,将汉字分为常用汉字和次常用汉字两级.次常用汉字的排列次序是按… -
归贤更昔:[答案] 在国家汉字标准GB2312-80中,一级常用汉字按(汉语拼音)规律排列,二级次常用汉字按(偏旁部首)规律排列.

宾阳县15980838833: 按8*8点阵存放国标GB2312 - 80中一级汉字(共3755个)的汉字库,大约需占存储空间多少 -
归贤更昔: 8点1字节=1B 8*8点=8B 3755*8B=30040B=(30040/1024)KB=29.3359375KB

宾阳县15980838833: 汉子国际码(GB2312 - 80)把汉字分成几个等级 -
归贤更昔: 国家标准GB2312-80提供了中华人民共和国国家标准信息交换用汉字编码,简称国标码.该字符集把常用汉字分成二级字库.一级字库3755个汉字,通常占使用汉字的90%左右,按拼音字母顺序排列.二级字库有3008个汉字,按部首顺序排列.另外还收录了一些图形符号.汉字和图形符号合计7445个.国标GB2312-80中所有的汉字在表中都有对应的区位码.

宾阳县15980838833: 按16*16点阵存放国标GB2312 - 80中一级汉字(共3755个)的汉字库,大约需占存储空间 -
归贤更昔: 一个汉字需用16*16点阵显示,一个字节(Byte)有8位(bit),一位代表一个点,故一个字节只能表示8个点,一个16*16点阵的汉字要占32 (2*16)个字节.3755个一级汉字共需3755*32=120160个字节.而1KB=1024Byte,所以一级汉字字库需占117KB存储空间,取2的整数次方,答案为128KB

宾阳县15980838833: 汉字国标码(GB2312 - 80)规定的汉字编码,每个汉字用: -
归贤更昔:[选项] A. :1个字节表示 B. :2个字节表示 C. :3个字节表示 D. :4个字节表示

宾阳县15980838833: 国标码GB/T2312---1980中,共收录汉字和图形符号( )个 选项:a、7445 b、6763 c、3755 d、3008 -
归贤更昔:[答案] GB/T2312-1980 4.3本标准收一般符号,序号,数字,拉丁字母,日文假名,希腊字母,俄文字母,汉语拼音符号,汉语注音字母,汉字等,共7445个图形字符. 4.3.1一般符号 202个.其中包括间隔,标点符号,运算符号,单位符号以及制表符号. 4.3....

宾阳县15980838833: 国标GB2312 - 80中收集的一级、二级常用汉字都是按拼音字母顺序排列的吗? -
归贤更昔:[答案] 计算机中信息的编码 在计算机中,各种信息都是以二进制编码的形式存在的;也就是说,不管是文字、图形、声音、动画,... 跨学科的知识领域. 1、字符(英文,包括字母、数字、标点、运算符等)编码 字符的编码采用国际通用的ASCII码(...

宾阳县15980838833: GB2312 - 80中的二级汉字是按-------排序的? -
归贤更昔: GB2312-80规定常用的二级汉字按(偏旁部首)排序 国标GB2312-80中收集的一级汉字是按拼音字母顺序排列的,而二级汉字是按部首排列的.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网