什么事国标码和基内码?

作者&投稿:张仇 (若有异议请与网页底部的电邮联系)
什么是国标码?机内码/机外码?字型码?~

计算机中汉字的表示也是用二进制编码,同样是人为编码的。根据应用目的的不

同,汉字编码分为外码、交换码、机内码和字形码。1.外码(输入码)�

外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。英文字母只有26个,可以把所有的字符都放到键盘上,而使用这种办法把所有的汉字都放到键盘上,是不可能的。所以汉字系统需要有自己的输入码体系,使汉字与键盘能建立对应关系。目前常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。在后面的章节中,重点介绍智能全拼输入法和五笔字型输入法。�

2.交换码�

计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。我国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码。国标码字符集中收集了常用汉字和图形符号7445个,其中图形符号682个,汉字6763个,按照汉字的使用频度分为两级,第一级为常用汉字3755个,第二级为次常用汉字3008个。为了避开ASCII字符中的不可打印字符0100001--1111110(十六进制为21-7E),国标码表示汉字的范围为2121--7E7E(十六进制)。�

区位码是国标码的另一种表现形式,把国标GB2312--80中的汉字、图形符号组成一个94×94的方阵,分为94个“区”,每区包含94个“位”,其中“区”的序号由01至94,“位”的序号也是从01至94。94个区中位置总数=94×94=8836个,其中7445个汉字和图形字符中的每一个占一个位置后,还剩下1391个空位,这1391个位置空下来保留备用。所以给定“区”值和“位”值,用四位数字就可以确定一个汉字或图形符号,其中前两位是“区”号。后两位是“位”号,如“普”字的区位码是“3853”,“通”字的区位码是“4508”。区位码编码的最大优点是没有重码,但由于编码缺少规律,很难记忆。使用区位码的主要目的是为了输入一些中文符号或无法用其它输入法输入的汉字、制表符以及日语字母、俄语字母、希腊字母等。94个区可以分为五组:�

01--15区:是各种图形符号、制表符和一些主要国家的语言字母,其中01--09区为标准符号区,共有682个常用符号。�

10--15区:为自定义符号区,可留作用户自己定义。�

16--55区:是一级汉字区,共有3755个常用汉字,以拼音为序排列。�

56--87区:是二级汉字区,共有3008个次常用汉字,以部首为序排列。�

88--94区:自定义汉字区,可留作用户自己定义。�

3.机内码�

根据国标码的规定,每一个汉字都有了确定的二进制代码,但是这个代码在计算机内部处理时会与ASCII码发生冲突,为解决这个问题,把国标码的每一个字节的首位上加1。由于ASCII码只用7位,所以,这个首位上的“1”就可以作为识别汉字代码的标志,计算机在处理到首位是“1”的代码时把它理解为是汉字的信息,在处理到首位是“0”的代码时把它理解为是ASCII码。经过这样处理后的国标码就是机内码。�

汉字的机内码、国际码和区位码之间的关系是:�

(汉字机内码前两位)16=(国标码前两位)16+80H=(区码)16+A0H�

(汉字机内码后两位)16=(国标码后两位)16+80H=(区码)16+A0H�

把用十六进制表示的机内码的前两位和机内码的后两位连起来,就得到完整的用十六进制表示的机内码。在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。�

4.汉字的字形码�

字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。为了能准确地表达汉字的字形,对于每一个汉字都有相应的字形码,目前大多数汉字系统中都是以点阵的方式来存储和输出汉字的字形。所谓点阵就是将字符(包括汉字图形)看成一个矩形框内一些横竖排列的点的集合,有笔画的位置用黑点表示,没笔画的位置用白点表示。在计算机中用一组二进制数表示点阵,用0表示白点,用1表示黑点。一般的汉字系统中汉字字形点阵有16×16、24×24、48×48几种,点阵越大对每个汉字的修饰作用就越强,打印质量也就越高。通常用16×16点阵来显示汉字,每一行上的16个点需用两个字节表示,一个16×16点阵的汉字字形码需要2×16=32个字节表示,这32个字节中的信息是汉字的数字化信息,即汉字字模。下面以“口”为例看看16×16点阵字形是怎样存放的(如图3--1)。�

如果我们把这个“口”字图形的“.”处用“0”代替,就可以很形象地得到“口”的字形码:0000H 0004H 3FFAH 2004H 2004H 2004H 2004H 2004H 2004H 2004H 2004H 2004H 3FFAH 2004H 0000H 0000H。计算机要输出“口”时,先找到显示字库的首址,根据“口”的机内码经过计算,再去找到“口”的字形码,然后根据字形码(要用二进制)通过字符发生器的控制在屏幕上进行依次扫描,其中二进制代码中是“0”的地方空扫,是“1”的地方扫出亮点,于是就可以得到“口”的字符图形。�

字模按构成字模的字体和点阵可分为宋体字模、楷体字模等等,这些是基本字模。基本字模经过放大、缩小、反向、旋转等交换可以得到美术字体,如长体、扁体、粗体、细体等等。汉字还可以分为简体和繁体两种,ASCII字符也可分为半角字符和全角字符。汉字字模按国标码的顺序排列,以二进制文件形式存放在存储器中,构成汉字字模字库,亦称为汉字字形库,称汉字库。����

0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7

0 . . . . . . . . . . . . . . . .

1 . . . . . . . . . . . . . 1 . .

2 . . 1 1 1 1 1 1 1 1 1 1 1 1 . .

3 . . 1 . . . . . . . . . . 1 . .

4 . . 1 . . . . . . . . . . 1 . .

5 . . 1 . . . . . . . . . . 1 . .

6 . . 1 . . . . . . . . . . 1 . .

7 . . 1 . . . . . . . . . . 1 . .

0 . . 1 . . . . . . . . . . 1 . .

1 . . 1 . . . . . . . . . . 1 . .

2 . . 1 . . . . . . . . . . 1 . .

3 . . 1 . . . . . . . . . . 1 . .

4 . . 1 1 1 1 1 1 1 1 1 1 1 1 . .

5 . . 1 . . . . . . . . . . 1 . .

6 . . . . . . . . . . . . . . . .

7 . . . . . . . . . . . . . . . .

图1-6 “口”字的16×16点阵字形图
参考资料: http://www.sxftc.edu.cn/course/school/pc_basic/jiaoan/1.4.htm

机内码是汉字在计算机内部使用的编码,国标码是在中国大陆使用最广泛的汉字编码字符集。其转换规则是:机内码是将国标码的每个字节都加上128,即将两个字节的最高位由0改1。
在汉字计算机编码标准中,最大的汉字编码是台湾的标准CNS11643,(4.0)共收录可考证之繁简、日、韩语汉字共76,067个,但并不普及,只有在户政系统等少数环境使用。台港民间通用的大五码收录繁体汉字13053个。
GB18030是中华人民共和国现时最新的内码字集,GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB2312收录简体汉字6763个。而Unicode的中日韩统一表意文字基本字集则收录汉字20902个,另有两个扩展区,总数亦高达七万多字。

扩展资料:
国标码(“国标”是中华人民共和国国家标准的简称)在中国大陆使用。GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。BIG5码。收录13053个汉字。在台湾和香港使用的一字节或两字节编码。
Unicode并不被中国政府很好的接受。中国政府要求在中国大陆出售的软件必须支持GB18030编码。在国际通信化和软件设计领域,CJK编码收集了汉语、日语、韩语中的汉字集。

1.汉字信息的编码知识 ⑴国标码:是指我国1981年公布的“中华人民共和国国家标准信息交换汉字编码”,代号为“GB2312-80”。由连续的两个字节组成。 2.机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码 3.输入码: 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。 4.字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。 编码的转换举例 汉字 区位码 16进制 国标码 机内码 文4636 2E24H 4E44H CEC4H “文”的区位码为4636,区码和位码分别用16进制表示即为“2E24H”, 0010 1110 0010 0100 转换成国标码“4E44H”,0100 1110 0100 0100 机内码为“CEC4H”, 1100 1110 1100 0100 回答时间:2006-09-12 11:50:48 计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,每个字节用七位码(高位为0),;国家标准将汉字和图形符号排列在一个94行94列的二维代码表中,;每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,;如“保”字在二维代码表中处于17区第3位,区位码即为“1703 ”。 国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,;再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。如:“保” 字的国标码为3123H,它是经过下面的转换得到的:1703D->1103H->+20H->3123H。 国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如“保” 字,国标码为31H和23H,而西文字符“1”和“#”的SCII也为31H和23H,现假如内存中有两个字节为31H和23H,;这到底是一个汉字 ,还是两个西文字符“1”;和“#”?于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,;汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B 即为B1A3H,因此, 字的机内码就是B1A3H;。


汉字机内码与国标码的差别
一个汉字的机内码与国标码之间的差别是前者各字节的最高位二进制值各为1,而后者为0。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。国家标准局颁布的《信息交换用汉字编码字符集基本集》(代号为GB231280)规定的...

一个汉字的机内码与国标码之间的差别是
两者码差别是在于最高位二进制值不同。1、二进制值:机内码各字节的最高位二进制值各为1,而国标码为0。2、含义:机内码,又称汉字ASCII码,是计算机内部用于存储、处理和传输汉字的一种编码,国标码,即国家制定的汉字编码标准,每个汉字都有一个对应的国标码,其目的是为了使每个汉字有一个全国...

国标码为什么是机内码?
在有些情况下,国标码有可能造成误解。因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又...

国标码与机内码之间区别是()
机内码和国标码之间的主要区别在于它们的二进制表示方式。在机内码中,每个字节的最高位是1,而国标码中,每个字节的最高位是0。这一差异导致了它们在计算机存储和处理字符时的不同表现。根据查询结果,机内码实际上是基于ASCII码的,而国标码则超出了ASCII码的范围,涵盖了更多的中文字符。因此,选项B...

汉字的区码、国码、机内码之间的关系如何?
3. 区位码直接转换为机内码:将区位码的两个字节分别转换为十六进制数,然后分别加上A0H(即160),得到对应的机内码。对于区位码3128,转换为十六进制后加A0H得到ACD8H,即机内码。总结来说,区位码通过特定的转换关系可以得到国标码和机内码,而国标码通过最高位加1可以得到机内码。这些码在计算机...

机内码与国标码有什么区别?
以方便机内的汉字处理汉字机内码是在计算机内部存储、处理的代码。计算机既要处理汉字,又要处理英文。因此计算机必须能区别汉字字符和英文字符。英文字符的的机内码是最高为为 0的8位ASCII码。为了不与7位ASCII码发生冲突,把国标码每个字节的最高位由0改为1,其余位不变的编码作为汉字字符的机内码。

如何理解国标码、区位码、机内码的关系?
汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到...

机内码与国标码区别是什么?
我这样跟你说个流程,可能不是非常确切,但可以帮助你理解:机外码→区位码→国标码→机内码。\\r\\n1、机外码就是你外界输入的字符,这个字符输入后会有一个相对应的区位码(就是一个94*94的棋盘格格,你输入的汉子会对应里面的一个格子,行+列就是我们这里的区+位),\\r\\n2、区位码经过换算...

汉字的机内码与国标码之间的差别是
两者之间的差别最高位二进制值不同。机内码各字节的最高位二进制值各为1,而国标码为0,具体来说,机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码。这种设计使得机内码能够有效地区分汉字和“ASCII”字符,避免了出现的二义性...

国标码是不是机内码
其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,因此机内码前后字节最高位都为1。如:“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B 即为B1A3H,因此,汉字的机内码就是B1A3H。通常,在DOS下的各汉字...

新疆维吾尔自治区14720901797: 什么事国标码和基内码? -
堵肢怡神: 1.汉字信息的编码知识 ⑴国标码:是指我国1981年公布的“中华人民共和国国家标准信息交换汉字编码”,代号为“GB2312-80”.由连续的两个字节组成. 2.机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来...

新疆维吾尔自治区14720901797: 什么是国标码 -
堵肢怡神: 即GB国标码:中文内码之一,代表中文简化字,在中国大陆广泛使用,影响所及,使用量渐见普及. “国家标准信息交换用汉字编码”(GB2312-80标准),简称国标码.国标码是指1980年中国制定的用于不同的具有汉字处理功能的计算机系统间交换汉字信息时使用的编码.国际码是二字节码, 用两个七位二进制数编码表示一个汉字.目前国标码收入6763个汉字, 其中一级汉字(最常用)3755个, 二级汉字3008个, 另外还包括682个西文字符、图符.

新疆维吾尔自治区14720901797: 什么是区内码,机内码,国标码请说明以上三种的详细概念,以及如何转换的过程, -
堵肢怡神:[答案] 1.区位码(十进制)转换成区位码(十六进制). 这里要把前两个位换成十六进制,然后后两位换成十六进制. 例如,某汉字... 2.国际码=区位码(十六进制)+2020H 例如,3630H+2020H=5050H 得到国标码GB2312 3.汉字机内码=国际码+8080H 机内...

新疆维吾尔自治区14720901797: 国标码、内码、区位码有什么相同之处和不同之处? -
堵肢怡神:[答案] 国标码一般指的是GB2312,或GBK,或GB18030,这些编码都是ANSI标准的. 内码指计算机内部表示一个字符的编码,同一编码在不同的字符集中代表不同的字符,上面提到的国标码是内码的一种. 区位码是汉字专有编码,是按汉字所在区,位进...

新疆维吾尔自治区14720901797: 汉字的常用编码输入码、机内码、输出码各是什么意思? -
堵肢怡神: 1.机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码. 2.输入码: 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码.一...

新疆维吾尔自治区14720901797: 机内码和国标码是什么? -
堵肢怡神: .国际码=区位码(十六进制)+2020H 例如,3630H+2020H=5050H 得到国标码GB2312 汉字机内码=国际码+8080H 机内码就是5050H+8080H=D0D0H ASCII码是八位的一个字节 最高位为0,这样可以区分和汉字编码的区别. Unicode是欧洲提出来的编码. 如果大段的数据包中的字节是大于A0A0H的双字节信息,可以初步认定为汉字内容编码. 说明一下,汉字你在数据包中只能获得机内码.区位码是输入码,不在计算机当中的,呵呵

新疆维吾尔自治区14720901797: 常用的汉字计算机机内码是什么?
堵肢怡神: 国标码.解析国标码:按国际标准制定的汉字和符号的交换码,国标GB2312—1980中收录了7445个汉字及字符,根据每一个字符的特点和位置,所有字符分为94个区、94个位.把区位码区和位分别转换成十六进制数,然后+2020H就是国标码.汉字的内部码:也称(机)内码,是计算机内处理汉字信息时所用的汉字代码,即内码=国标码+8080H.

新疆维吾尔自治区14720901797: 请问汉字国际码与机内码有什么区别 -
堵肢怡神: 汉字编码用两个字节进行编码,每个字节的最高位为0,这就是国标码.但如果就这样放入电脑,就会与一个字节的ASCII冲突.为此,规定放入机器时每个字节的最高位都置为1,这就是机内码. 可以将机内码看作是国标码的变形.它们的区别就是每个字节的最高位是否为1.

新疆维吾尔自治区14720901797: 机内码和国标码什么意思,怎么转换 -
堵肢怡神: 机内码是汉字在计算机内部使用的编码,国标码是在中国大陆使用最广泛的汉字编码字符集.其转换规则是:机内码是将国标码的每个字节都加上128,即将两个字节的最高位由0改1. 汉字分为输入码、区位码、国标码与机内码. 机内码是国...

新疆维吾尔自治区14720901797: 在汉字编码中,什么是外码、内码、国标码,他们之间的关系如何 -
堵肢怡神: 外码就是输入的时候用的(比如你输入拼音,或者输入全拼,或者五笔,要按的键就是外码) 内码是二进制编码(两个asc2字符=一个中文字符) 国际码是中文的编码格式,比如Gb2312 外码是输入文字的时候要用到的 内码和国际码之间可以互相转换

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网