急!!!汉字编码的一到九区是什么区?

作者&投稿:才昏 (若有异议请与网页底部的电邮联系)
请问高考时候使用的汉字编码是什么类型的编码?是UNICODE编码还是区位码什么的?急!急!急!~

汉字的区位码

区位码-简介

1980年,为了使每一个

汉字有一个全国统一的代码,我国颁布了第一个汉字编码 的国家标准: GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。
  国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码。
汉字库分布情况如下:
一级汉字 16-55区
二级汉字 56-87区
三级汉字 1-9区
空闲未用 10-15区
  通常,在DOS下的各汉字系统中,同时按Alt键和F1键即可调用区位码输入方法。而在Windows中常用Ctrl+空格键和Ctrl+Shift键调出区位码。如“2901”代表“健”字,“4582”代表“万”字,“8150”代表“楮”字,这些都是汉字,用区位码还可以很轻松地输入特殊符号,比如,“0189”代表“※”(符号),“0528”代表“ゼ”(日本语),“0711”代表“Й”(俄文),“0949”代表“┭”(制表符)。
  在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列), 在区位码汉字输入方法中,汉字编码无重码,在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住全部区位码是相当困难的,常使用于录入特殊符号,如制表符、希腊字母等,这里简单介绍几个区。
  


区位码-部分国际区位编码

  区号:01 【各类符号】
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0100  、 。 · ˉ ˇ ¨ 〃 々 - ~ ‖ … ' ' " " 〔 〕
  0120 〈 〉 《 》 「 」『 』 〖 〗 【 】 ± × ÷ ∶ ∧ ∨ ∑ ∏
  0140 ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠ ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯
  0160 ≤ ≥ ∞ ∵ ∴ ♂ ♀ ° ′ ″ ℃ $ ¤ ¢ £ ‰ § № ☆ ★
  0180 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓
  区号:02 【各类数字】
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0200 ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ            ⒈ ⒉ ⒊
  0220 ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖ ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶
  0240 ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾ ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③
  0260 ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩ 一 二 三 四 五 六 七 八 九 十
  0280 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ
  区号:03 【符号、字母】
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0300 ! " # ¥ % & '( ) * + , - . / 0 1 2 3
  0320 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G
  0340 H I J K L M N O P Q R S T U V W X Y Z [
  0360 \ ] ^ _ ` a b c d e f g h i j k l m n o
  0380 p q r s t u v w x y z { | }  ̄
  区号:06 【罗马字母】
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0600 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ
  0620Υ Φ Χ Ψ Ω            α β γ δ ε ζ η
  0640θ ι κ λ μ ν ξ ο π ρ σ τ υ φ χ ψ ω
  0660 0680
  区号:08 【汉语拼音】
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0800 ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ ò ū ú ǔ
  0820 ù ǖ ǘ ǚ ǜ ü ê ㄅ ㄆ ㄇ
  0840 ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ ㄐ ㄑ ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ ㄚ ㄛ
  0860 ㄜ ㄝ ㄞ ㄟ ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ ㄦ ㄧ ㄨ ㄩ
  0880  
  区号:09 【制表字符】
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  0900 ─ ━ │ ┃ ┄ ┅ ┆ ┈ ┉ ┉ ┊ ┋ ┌ ┍ ┎ ┏
  0920 ┐ ┑ ┒ ┓ └ ┕ ┖ ┗ ┘ ┙ ┚ ┛ ├ ┝ ┞ ┟ ┠ ┡ ┢ ┣
  0940 ┤ ┥ ┦ ┧ ┨ ┩ ┪ ┫ ┬ ┭ ┮ ┯ ┰ ┱ ┲ ┳ ┴ ┵ ┶ ┷
  0960 ┸ ┹ ┺ ┻ ┼ ┽ ┾ ┿ ╀ ╁ ┃ ╃ ╄ ╅ ╆ ╇ ╈ ╉ ╊ ╋
  0980

为汉字设计的一种便于输入计算机的代码。由于电子计算机现有的输入键盘与英文打字机键盘完全兼容。因而如何输入非拉丁字母的文字(包括汉字)便成了多年来人们研究的课题。
汉字信息处理系统一般包括编码、输入、存储、编辑、输出和传输。编码是关键。不解决这个问题,汉字就不能进入计算机。
汉字进入计算机的三种途径 分别为:
①机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。
②通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。
③通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机。
机器自动识别汉字和汉语语音识别,国内外都在研究,虽然取得了不少进展,但由于难度大,预计还要经过相当一段时间才能得到解决。在现阶段,比较现实的就是通过汉字编码方法使汉字进入计算机。
汉字编码的困难点 汉字进入计算机,有许多困难,其原因主要有三点:
①数量庞大:随着社会的发展,新字不断出现,死字没有淘汰,汉字总数不断增多。一般认为,现在汉字总数已超过6万个(包括简化字)。虽有研究者主张规定3000多或4000字作为当代通用汉字,但仍比处理由二三十个字母组成的拼音文字要困难得多。
②字形复杂:有古体今体,繁体简体,正体异体;而且笔画相差悬殊,少的一笔,多的达36笔,简化后平均为9.8笔。
③存在大量一音多字和一字多音的现象:汉语音节416个,分声调后为1295个(根据《现代汉语词典》统计,轻声39个未计)。以1万个汉字计算,每个不带调的音节平均超过24个汉字,每个带调音节平均超过7.7个汉字。有的同音同调字多达66个。一字多音现象也很普遍。
五种类型的编码法 据粗略统计,现有400多种编码方案,其中上机通过试验的和已被采用作为输入方式的也有数十种之多。归纳起来,不外5种类型:
①整字输入法:前一阶段,一般是将三四千个常用汉字排列在一个具有三四百个键位的大键盘上。近来,大多是将这些汉字按XY坐标排列在一张字表上,通常叫“字表法”,或“笔触字表法”。比如,X25行和Y90列交叉的字为“国”,当电笔点到字表上的“国”字时,机器自动将该字的代码2590输入。键盘上或字表中字按部首或按音序或按字义联想而排列。不常用的字作为盘外字或表外字,另行编码处理。
②字形分解法:将汉字的形体分解成笔画或部件,按一定顺序输进机器。笔画一般分成 8种:横(一)、竖(丨)、撇(丿)、点(丶)、折(□)、弯(□)、叉(十)、方(口)。部件一般归纳出一二百个。由于一般键盘上只有42个键(包括数字和标点),容纳不下这么多部件,因而有人设计中键盘,也有人利用部件形体上的相似点或出现概率的不同,而把100多个部件分布在26个字母键上。
③字形为主、字音为辅的编码法:这种编码法与字形分解法的不同在于还要利用某些字音信息。如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码,有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母。
④全拼音输入法:绝大多数是以现行的汉语拼音方案为基础进行设计。关键问题是区分同音字,因而有的方案提出“以词定字”的方法,还有的方案提出“拼音-汉字转换法”,即“汉语拼音输入 ——机内软件变换(实为查机器词表)——汉字输出”系统。
⑤拼音为主、字形为辅的编码法:一般在拼音码前面或后面再添加一些字形码。拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”。如F键既表声母F,又表韵母ang,连击两下,便是Fang“方”字。区分同音字的字形码也多种多样。除了大部分采用偏旁部首的信息外,还有采用起末笔或采用语义类别的。
上述各种编码法,各有短长。例如,字表法的特点是一字一格(键),无重码,直观性好,操作简单。缺点是需特制键盘,速度较慢。字形分解法的好处是按形取码,不涉及字音,因而不认识的字(包括生僻字、古字)也同样可以编码输入;但汉字形体结构非常复杂,写法也有许多差异,分解标准不易统一,因而不少方案规则较多。拼音输入法(包括拼音-汉字转换法)的优点是操作简捷,可以“盲打”,不受汉字简化、字形改变的影响,符合拼音化方向,并且还便于作进一步信息处理;缺点是不认识的字无法输入;另外,如果不加字形码或不用以词定字法或显式选择法,同音字较难处理。
双轨制编码 汉语拼音推广应用,并逐步过渡到汉字和汉语拼音文字并存并用,这是一种双轨制。汉字信息处理领域中,音码和形码的并存并用,同样是一种双轨制。因此,不少人认为,采用双轨制好,理由有以下5点:
①对掌握普通话的人来说,使用音码比形码方便,速度比较快。形码虽然较慢,但能输入任何汉字(包括古字)。采用双轨,操作员认识的字可按音输入,不认识的字按形输入,会普通话的人可按音输入,方音重的人可按形输入。
②对于用字量少的单位,按音输入无问题,但对用字量多的单位来说,按音输入就不如按形输入,因为一般人只能念出一部分汉字。
③按形输入(尤其是整体输入)对于中文信息处理的某类工作,如统计汉字,非常适合;但是对于其他类工作,例如统计汉语的音(声韵调)则无能为力。按音输入则正相反。双轨正好是相辅相成。
④有的形码可以照顾多种汉字(如日本的汉字、南朝鲜的汉字),而音码能分词连写,便于作进一步的信息处理。
⑤适当的双轨方案,不会增加设备上的麻烦。如不考虑采用整字输入,一般均可使用现有的小键盘。
汉字编码研究的新发展 除了单轨向双轨发展之外,还有下列趋势:
①混合式编码法。笔触字表示法中除整体字之外,增加一些部件或字元,可以解决盘外字问题,甚至能具有字形分解法的全部优点。而笔画方案为了提高速度,一般也增加一些部件或整字。
②充分利用简码和词汇码。这样可以提高输入速度。因而人们为少量出现频率高的字或词设计了单字母和双字母的简码。
词汇码也是提高速度的手段。有一种形码方案的词汇码是根据每个字的部件规定的,如“汉字编码”的词汇码是43、45、55、13(氵冖纟石)。另一种形码方案的词汇码是利用计算机引导方式输入的。例如,当“中”字输入后,一按语词键,屏幕上便显示出“中国”、“中型”、“中性”、“中华”等双音词;选择“中国”后,如再按一下语词键,便可显示出“(中国)话”、“(中国)人民”、“(中国)共产党、”、“(中国)工农红军”等词或词组。音码方案的词汇码实际上为词组码,如 ZRG“中华人民共和国”,ZZXY“中国中文信息研究会”。词汇码不仅能提高速度,而且也能区别同码。但是,如果用得太多,也会产生重码。因此,有必要划分通用词汇码和专业词汇码,以减少重码。
③充分发挥“电脑”的作用,尽量减少“人脑”的负担。上述计算机引导输入法就是一例。还有的方案不断以开窗口方式向操作员提供选择的范围。这样,操作员不必再记忆大量的编码规则。
编码工作中的定型化和标准化 编码方案的定型化,即一般所说的选优工作,对计算机的普及应用非常重要。当然,定型或选优并不意味着只定一种或只选一种,而要照顾到多种用户的需要。关于选优,曾提出多种评定标准,一般包括字码无二义性、操作方便易学、输入和处理效率高、存储节省、传输可靠、设备经济实用、组词能力强。
GB2312-80称为汉字编码,其中01-09区为符号、数字区

GB2312-80称为汉字编码,其中01-09区为符号、数字区


汉字输入编码有4种方式,哪一种的编码方式是固定的
数字编码方式是固定的。汉字编码方案的一种,可归结为下列几种类型:1、汉字拼音编码。以汉语拼音为基础的汉字输入编码,在汉语拼音键盘或经过处理的西文键盘上,根据汉字读音直接键入拼音。2、汉字字形编码。所有的汉字都由横、竖、撇、点、折、弯有限的几种笔划构成,并且又可分为‘左右’、‘上下’、...

区位码的每个汉字编码的第一个字节是什么
区位码的每个汉字编码的第一个字节是区码。区位码,它的前两位叫做区码,后两位叫做位码。区位码是一个四位的十进制数。

属于汉字编码的是
属于汉字编码的是BIG5码等。汉字的编码体系主要有以下几种:1、国标、区位“准国标”国标是将七千余个汉字以及标点符号、外文字母等,排成一个94行、94列的方阵。方阵中每一横行称为一个“区”,每个区有94个“位”。一个汉字在方阵中的坐标,称为该字的区位码;2、GBK码,GB码的扩展字符编码,...

汉字的编码有几种?各有什么用途?
汉字的编码分为外码、交换码、机内码、字形码和地址码。具体用途如下:1、外码(输入码)外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低...

我国颁布的第一个汉字编码标准是
我国颁布的第一个汉字编码标准是GB2312。GB2312是我国于1980年颁布的第一个汉字编码标准。在此之前,由于汉字数量庞大且多种多样,缺乏统一的编码标准,导致信息交换和处理存在困难。GB2312的制定填补了这一空白,规定了6763个常用汉字的二进制编码,包括汉字的基本图形字符和其对应的编码。这一标准的发布...

汉字国内码的前一个字节是什么码?
汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器...

如何给一个汉字编码?
汉字编码是为了在计算机中处理、存储和传输汉字而设计的一种编码方式。下面详细介绍两种常见的汉字编码方式:1. GB2312编码:GB2312是中国国家强制标准,包含了6763个常用汉字和非汉字字符。这是一个双字节编码,即每个汉字由两个字节表示。例如,汉字“中”在GB2312中的编码是D6D0(十六进制)...

若中文windows环境下西文使用标准ASCII码,汉字采用GB2312编码,设...
答案是B,4个汉字和2个西文字符。判断方法是,看每个内码是否大于80,如果大于80,它就是汉字编码的一部分。小于80,它就是ASCII码。这道题中,有8个内码大于80,所以是四个汉字(每个汉字占两个内码),有2个内码小于80,所以是两个ASCII码(每个ASCII码占一个内码)。

汉字的字形码又称为
汉字的字形码又称为如下:汉字的字形码又称为汉字编码(ChineseCharacterCode),是指将汉字转换成计算机可处理的二进制编码形式。它是计算机处理汉字的基础,也是汉字信息处理的重要技术之一。

汉字的国家标准编码原则是一个汉字用几个字节表示
2个。汉字的国家标准编码原则是:一个汉字用2个字节表示,由于汉字数量极多,一般用连续的两个字节(16个二进制位)来表示一个汉字。

蕉岭县13473637791: 2、 GB2312 - 80称为汉字编码,其中01 - 09区为()区. -
官迫重组: GB2312-80称为汉字编码,其中01-09区为符号、数字区

蕉岭县13473637791: 汉字国际码把汉字和字符分为多少区 -
官迫重组: 一共分为94区国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码.汉字库分布情况如下:一级汉字 16-55区二级汉字 56-87区三级汉字 1-9区空闲未用 10-15区

蕉岭县13473637791: 拼音码、王码、区位码、国际码分别是什么 -
官迫重组: 字的输入法概述汉字编码方案数百种,但编码的方式不外乎四大类:流水码—— 用数字组成的等长编码(编码的长度相等),如国标码、区位码.音 码—— 根据汉字读音组成的编码,如拼音码.形 码—— 根据汉字的形状、结构特征组成的...

蕉岭县13473637791: GB2312 汉字的内码是从什么到什么?
官迫重组: GB 2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号.这种表示方式也称为区位码. �6�1 01-09区为特殊符号. �6�1 16-55区为一级汉字,按拼音排序. �6�1 56-87区为二级汉字,按部首/笔画排序. 10-15区及88-94区则未有编码. 举例来说,“啊”字是GB2312之中的第一个汉字,它的区位码就是1601

蕉岭县13473637791: 怎么看哪个是汉字的国际码? -
官迫重组: GB2312对汉字的编码范围是:1601~8795.所以A505和B515不是国标码.C的6525是“峁”,D的8515是“醑”.1. 汉字国际码,指国家标准"信息交换用汉字编码字符集".拼音:hàn zì guó jì mǎ 包括国家标准号为gb2312-80的基本集及...

蕉岭县13473637791: 汉字国标码规定了一级汉字 - -----个,二级汉字------个 -
官迫重组: 为适应计算机处理汉字信息的需要,我国于1981年发布了《信息处理交换用汉字编码字符集 基本集》GB2312-80 GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(2OH),因此也称为区位码.01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区.GB2312将收录的汉字分成两级:第一级是常用汉字计 3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列.故而 GB2312最多能表示6763个汉字

蕉岭县13473637791: 计算机知识:汉字编码的规则?
官迫重组: GB2312中的汉字编码规则 2008-07-26 21:56:10 标签:GB2312 汉字编码规则 休闲 职场 01-09区为特殊符号. 16-55区为一级汉字,按拼音排序. 56-87区为二级汉字,按部首/笔画排序. 每个汉字及符号以两个字节来表示.第一个字节称为“高位字节”,第二个字节称为“低位字节”. “高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0). 例如“啊”字在大多数程序中,会以0xB0A1储存.(与区位码对比:0xB0=0xA0+16,0xA1=0xA0+1). 在附送你个 GB2312 编码表

蕉岭县13473637791: 在GB2313 - 80一级汉字按什么顺序排列? -
官迫重组: 在GB2313-80 一级汉字按照拼音 二级汉字按照笔画 首先说明 gb2312 的编码规则 汉字采用区位码表示 每个区有 94 个汉字容量. 1~94 区的编码从 1开始倒94 所以gb2312的最大编码容量是 94*94 (实际上只包含了6737个汉字) 区码: 1~8 是符号区,全角英文字母,希腊、日文、俄文等等, 9 区是造表符号 10~15 空,未定义, 16~55 一级字库 汉字3755个,采用拼音排序; 56-87 二级字库,汉字3008个,采用部首排序; 87~94空 由于此编码方案顶得比较早,有很多不完善的地方,所以后来有了 gb12345,和gb 13000 等其他编码方案.

蕉岭县13473637791: 汉字国标GB2312 -
官迫重组: GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集——基本集》,由国家标准总局发布,1981年5月1日实施,通行于大陆.新加坡等地也使用此编码.GB 2312中对所收汉字进行了“分区”处理,每区含...

蕉岭县13473637791: 怎么翻译汉字区位码? -
官迫重组: 1980年,为了使每一个汉字有一个全国统一的代码,我国颁布了第一个汉字编码 的国家标准: GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准.国...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网