中国推出几个汉字编码字符集?

作者&投稿:淡征 (若有异议请与网页底部的电邮联系)
1981年,中国政府公布了《信息交换汉字编码字符集》中现代汉字数量是多少~

《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980。GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。把换算成十六进制的区位码加上2020H,就得到国标码。国标码加上8080H,就得到常用的计算机机内码。1995年又颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20902字。

汉字是中华文明中不可缺少的一部分,它不但承载了我们几千年的历史,而且也是从古到今人们进行沟通的重要手段。由汉字衍生出来的书法艺术,更是中华文明的瑰宝。但是,汉字,是怎么造出来的?
研究汉字的起源问题,在国内已有两千五百多年的历史了。
先秦传说造字者为仓颉,《旬子·解蔽》记载:“好书者众矣,而仓颉独传者壹也。”《吕氏春秋》记载:“奚仲作车,仓颉作书”。相传仓颉是黄帝的史官,是古代整理文字的一个代表人。《说文解字》记载:仓颉是黄帝时期造字的史官,被尊为“造字圣人”。史学家徐旭认为,文字的出现,应与仓颉有关。那时制定历法需要文字记载,制定神谕也需要行文,因此,仓颉应是颛顼部族人。他“生于斯,葬于斯”,故造书台北有仓颉陵墓。他所处的年代约为公元前26世纪。据此推测,四、五千年前,我国的文字就比较成熟了。
到了现代,有人在承认仓颉的同时又扩大了造字者的队伍。比如鲁迅先生,他认为“......在社会里,仓颉也不是一个,有的在刀柄上刻一点图,有的在门户上画一些画,心心相印,口口相传,文字就多起来了,史官一采集,就可以敷衍记事了。中国文字的来由,恐怕逃不出这例子。”《鲁迅.门外文谈》。也就是说,汉字当然不可能是仓颉一个人创造出来的,而是由许许多多的像仓颉这样的人慢慢丰富起来的,仓颉只不过在这些人当中比较重要、起的作用比较大而已。我们所重视的不是到底是不是仓颉造的汉字,而是造字这件事本身的意义。汉字的出现,标志着中国历史走进了由文字记载的时代,是历史长河中的一件大事,对后世也有着重要的影响。
仓颉造字
仓颉,姓侯刚,号史皇氏,黄帝时史官,汉字创始人,被尊为“造字圣人”。今南乐县城西北35华里吴村有仓颉陵、仓颉庙和造书台,史学家认为仓颉生于斯,葬于斯。
相传仓颉“始作书契,以代结绳”。在此以前,人们结绳记事,即大 事打一大结,小事打一小结,相连的事打一连环结。后又发展到用刀子在木竹上刻以符号作为记事。随着历史的发展,文明渐进,事情繁杂,名物繁多,用结和刻木的方法,远不能适应需要。,这就有创造文字的迫切要求。黄帝时是上古发明创造较多的时期,那时不仅发明了养蚕,还发明了舟、车、弓驽、镜子和煮饭的锅与甑等,在这些发明创造影响下,仓颉也决心创造出一种文字来。
传说仓颉;四目重瞳,非常聪明,有一年,仓颉到南方巡狩,登上一座阳虚之山(现在陕西省雒南县),临于玄扈洛?之水,忽然看见一支大龟,龟背上面有许多青色花纹。仓颉看了觉得稀奇,就取来细细研究。他看来看去,发现龟背上的花纹竟是有意义可通的。他想花纹既能表示意义,如果定下一个规则,岂不是人人都可用来传达心意,记载事情幺?
仓颉日思夜想,到处观察,看尽了天上星宿的分布情况、地上山川脉络的样子、鸟兽虫鱼的痕迹、草木器具的形状,描摹绘写,造出种种不同的符号,并且定下了每个符号所代表的意义。他按自己的心意用符号拼凑成几段,拿给人看,经他解说,倒也看得明白。仓颉把这种符号叫作"字"。
仓颉造字成功,发生了怪事,那一天白日竟然下粟如雨,晚上听到鬼哭魂嚎。为什幺下粟如雨呢?因为仓颉造成了文字,可用来传达心意、记载事情,自然值得庆贺。但鬼为什幺要哭呢?有人说,因为有了文字,民智日开,民德日离,欺伪狡诈、争夺杀戮由此而生,天下从此永无太平日子,连鬼也不得安宁,所以鬼要哭了。
还有一种说法是:
有一次,仓颉就是从这些绳结记录的史书给黄帝提供的史实出了差错,致使黄帝在和炎帝的边境谈判中失利。事后,仓颉愧而辞官云游天下,遍访录史记事的好办法。三年后他回到故乡白水杨武村,独居深沟“观奎星圜曲之式,察鸟兽蹄爪之迹”,整理得到的各种素材,创造出了代表世间万物的各种符号。他给这些符号起了个名字,就叫做字。
仓颉的字都是依照万物的形状造出来的。譬如:日字是照着太阳红圆红圆的模样勾的;月字是仿着月牙儿的形状描的;人字是端详着人的侧影画的……仓颉首创文字的事后来被黄帝知道了,他大为感动,乃赐仓姓。其意是君上一人,人上一君。再后来,上天知道了这件事,下了一场谷子雨奖励仓颉。这便是人间谷雨节的由来。
从白水县城出发,沿渭(南)清(涧)公路下洛河,然后再改走白(水)洛(川)公路。吉普车在高原的沟岔间跑了一个小时左右,才来到了仓颉庙所在的史官村。这座已有1800余年历史的仓颉庙已被国务院正式列为国家级重点文物保护单位。
仓颉陵在吴村西侧,与仓颉庙西东相望,是一个高五米的大土丘。陵墓以下有仰韶至龙山时期的古文化遗存。陵前翁仲,石狮俱存,并建有石坊,上书“仓颉”二字。仓颉庙,始建年代不详。据庙内现存碑刻记载,“历汉唐以来,未尝稍替”。如今看到的仓颉庙是明清时的建筑,占地约两千七百平方米,座北朝南,有石望柱一对,雕刻精美雅致;山门、二门皆为硬山式建筑,拜殿、正殿和寝阁大方美观。还有明代名人篆额题联和仓颉夫妇的石雕。庙内碑刻林立,松柏苍翠,杨柳依依,楼台亭阁鳞次栉比,整个建筑雄伟壮观

记录汉语的文字系统,并仍然或曾经在日语和朝鲜语、越南语中使用。汉字是世界上最古老的文字之一,拥有4500年以上的历史。狭义地说,它是汉族的文字;广义地言,它是汉字文化圈共同的文字。

汉字是汉语书写的最基本单元,其使用最晚始于商代,历经甲骨文、大篆、小篆、隶书、楷书(草书、行书)诸般书体变化。秦始皇统一中国,李斯整理小篆,“书同文”的历史从此开始。尽管汉语方言发音差异很大,但是书写系统的统一减少了方言差异造成的交流障碍。

东汉许慎在《说文解字》中将汉字构造规律概括为“六书”:象形、指事、会意、形声、转注、假借。其中,象形、指事、会意、形声四项为造字原理,是“造字法”;而转注、假借则为用字规律,是“用字法”。

三千余年来,汉字的书写方式变化不大,使得后人得以阅读古文而不生窒碍。但近代西方文明进入东亚之后,整个汉字文化圈的各个国家纷纷掀起了学习西方的思潮,其中,放弃使用汉字是这场运动的一个重要方面。这些运动的立论以为:跟西方拼音文字相比,汉字是繁琐笨拙的。许多使用汉字国家即进行了不同程度的汉字简化,甚至还有完全拼音化的尝试。日文假名的拉丁转写方案以及汉语多种拼音方案的出现都是基于这种思想。中国大陆将汉字笔画参考行书草书加以省简,于1956年1月28日审订通过《简化字总表》,在中国及新加坡使用至今。台湾则一直使用繁体中文。

汉字是承载文化的重要工具,目前留有大量用汉字书写的典籍。不同的方言都使用汉字作为共同书写体系,因而汉字在历史上对中华文明的传播起到了重要作用,并成为东南亚文化圈形成的内在纽带。在汉字发展过程中,留下了大量诗词、对联等文化,并形成了独特的汉字书法艺术。

一个汉字一般具有多种含义,也具有很强的组词能力,且很多汉字可独立成词。这导致了汉字极高的“使用效率”,2000左右常用字即可覆盖98%以上的书面表达方式。加之汉字表意文字的特性,汉字的阅读效率很高。汉字具备比字母文字更高的信息密度,因此,平均起来,同样内容的中文表达比其他任何字母语言的文字都短。

目前在使用汉语的地区,大都使用两种规范汉字,分别是繁体中文(繁体字)和简体中文(简体字)。 前者用于台湾、香港、澳门和北美的华人圈中,后者用于中国大陆和新加坡以及东南亚的华人社区。通常说来,两种汉字书写系统虽然有差异,常用汉字的个体差异不到25%。

由于汉字书写复杂,“汉字落后论”的说法存在了很长时间,认为汉字是教育及信息化瓶颈,并有“汉字拉丁化”甚至废除汉字的推动行为。现在一般认为汉字也有突出优点,初始学习难度虽大,但掌握常用字后不存在类似海量英文单词的继续学习问题,且其表意特性也能充分调动人脑的学习能力。在计算机输入问题基本解决后,“汉字落后论”及“汉字拉丁化”已实际上逐渐被大多数人抛弃。

目前汉字系统已经基本稳定,但汉字的规范化、生僻字的自然消亡仍在继续进行。

推出了6个符集。



汉字字符集标准 (其中GB开头的是国家标准) 
① GB2313字符集,收入汉字6763个,符号715个,总计7478个字符,这是大陆普遍使用的简体字符集。楷体-GB2313、仿宋-GB2313、华文行楷等市面上绝大多数字体支持显示这个字符集,亦是大多数输入法所采用的字符集。市面上绝大多数所谓的繁体字体,其实采用的是GB-2313字符集简体字的编码,用字体显示为繁体字,而不是直接用GBK字符集中繁体字的编码,错误百出。
  ② BIG-5字符集,收入13060个繁体汉字,808个符号,总计13868个字符,目前普遍使用于台湾、香港等地区。台湾教育部标准宋体楷体等港台大多数字体支持这个字符集的显示。
  ③ GBK字符集,又称大字符集(GB=GuóBiāo国标,K=扩展),包含以上两种字符集汉字,收入21003个汉字,882个符号,共计21885个字符,包括了中日韩(CJK)统一汉字20902个、扩展A集(CJK Ext-A) 中的汉字52个。Windows 95\98简体中文版就带有这个GBK.txt文件。宋体、隶书、黑体、幼圆、华文中宋、华文细黑、华文楷体、标楷体(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字体支持显示这个字符集。微软拼音输入法2003、全拼、紫光拼音等输入法,能够录入如镕镕炁夬喆嚞姤赟赟龑昳堃慜靕臹等GBK简繁体汉字。
  BIG-5 (繁体中文)与GB-2313 (简体中文),编码不相兼容,字符在不同的操作系统中便产生乱码。文本文字的简体与繁体(文字及编码)之间的转换,可用BabelPad、TextPro或Convertz之类的转码软件来解决。若是程序,Windows XP操作系统,可用Microsoft AppLocale Utility 1.0解决;Windows 2000的操作系统,大概只有用:中文之星、四通利方、南极星、金山快译之类的转码软件方能解决了。
  ④ GB18030字符集,包含GBK字符集、CJK Ext-A 全部6582个汉字,共计27533个汉字。宋体-18030、方正楷体(FZKai-Z03)、书同文楷体(MS Song)宋体(ht_cjk+)、香港华康标准宋体(DFSongStd)、华康香港标准楷体、CERG Chinese Font、韩国New Gulim,以及微软Windows Vista操作系统提供的宋黑楷仿宋等字体亦支持这个字符集的显示。Windows 98支持这个字符集,以下的字符集则不支持。手写输入法逍遥笔4.0版支持GB18030字符集及方正超大字符集汉字的录入。
  ⑤ 方正超大字符集,包含GB18030字符集、CJK Ext-B中的36862个汉字,共计64395个汉字。宋体-方正超大字符集支持这个字符集的显示。Microsoft Office XP或2003简体中文版就自带有这个字体。Windows 2000的操作系统需安装超大字符集支持包“Surrogate更新”。
  ⑥ ISO/IEC 10646 / Unicode字符集,这是全球可以共享的编码字符集,两者相互兼融,涵盖了世界上主要语文的字符,其中包括简繁体汉字,计有:CJK统一汉字20902个,CJK Ext-A 6582个,Ext-B 42711个,共计70195个汉字。SimSun-ExtB(宋体)、MingLiU-ExtB(细明体)能显示全部Ext-B汉字。至今尚无单独一款字体能够显示全部70195个汉字,但可用海峰五笔、新概念五笔、仓颉输入法世纪版、新版的微软新注音、仓颉输入法 6.0 版(单码功能)等输入法录入。Ext-C还有2万多个汉字。详情请参阅香港中文大学网站、马来西亚仓颉之友网站、福建陈清钰个人网站。
  ⑦ 汉字构形数据库2.3版,内含楷书字形60082个、小篆11100个、楚系简帛文字2627个、金文3459个、甲骨文177个、异体字12768组。可以安装该程序,亦可以解压后使用其中的字体文件,对于整理某些古代文献十分有用。

这个不同统计。
粗略地说,有以下几个:
1.GB-2312字符集,6763个汉字。 GB是“国标”两字的首字母。【GBK字符集:严格地说这个字符集不是国家规范。有汉字(包括部首和构件)21003 个,图形符号 883 个】。

2.GB18030字符集。GB18030-2000版本有27533个汉字,最新版是GB18030-2005,收汉字70000余个。

5个汉字编码集

  1. 2进制




中国推出几个汉字编码字符集?
推出了6个符集。GB2313字符集,收入汉字6763个,符号715个,总计7478个字符,这是大陆普遍使用的简体字符集。楷体-GB2313、仿宋-GB2313、华文行楷等市面上绝大多数字体支持显示这个字符集,亦是大多数输入法所采用的字符集。市面上绝大多数所谓的繁体字体,其实采用的是GB-2313字符集简体字的编码,用...

中国推出几个汉字编码字符集?
中国推出了多个汉字编码字符集,其中最早的是GB2312,它是在1980年推出的,主要用于简体中文字符的编码。随后,中国又推出了GBK字符集,它在GB2312的基础上增加了更多的字符,以支持更多的汉字以及一些符号。GBK字符集在1995年发布。2000年,GB 18030字符集被推出,它是对GBK的扩展,不仅包含了所有GBK的字...

国标码中共有多少个汉字
目前国标码收入6763个汉字, 其中一级汉字(最常用)3755个, 二级汉字3008个, 另外还包括682个西文字符、图符。

目前我国使用的汉字编码方案是什么
GB码:GB码是1980年国家公布的简体汉字编码方案,在大陆、新加坡得到广泛的使用,也称国标码。国标码对6763个汉字集进行了编码,涵盖了大多数正在使用的汉字。GBK码:GBK码是GB码的扩展字符编码,对多达2万多的简繁汉字进行了编码,向下与GB码兼容,简体版Windows是使用GBK作系统内码。BIG5码:BIG5码是针...

我国汉字编码的国家标准是什么
汉字编码国家标准,分为双字节部分和四字节部分,而双字节部分和GBK基本完全相同,四字节部分到目前为止,比GBK多了6582个汉字。现有汉字编码:GB2312至1980是信息交换用汉字编码字符集基本集,GBK1995为汉字内码扩展规范,GB130001至1993即为信息技术,通用则为多八位编码字符集。

我国的汉字编码方法有几种?
计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码。3、机内码 根据国标码的规定,每一个汉字都有了确定的二进制代码,...

中国国家标准汉字信息交换编码
GB2312编码包含了6763个汉字和682个其符号,包括一级汉字、二级汉字以及拉丁字母、希腊字母和日文假名等字符。这些字符基本满足了当时社会的需求。GB2312采用双字节表示每一个字符,通过区码和位码的组合,能够表示上述所有的字符和符号。同时,GB2312编码兼容ASCII码,使得可以很好地与国际标准接轨。GB2312在...

汉字国际标码(GB2312-80)把汉字分为2个等级其中一级常用汉字的排列顺序...
一级常用汉字的排列是按汉语拼音字母顺序的。在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。GB2312将收录的汉字分成两级:第一级是常用汉字计 3755个,置于16-55区,按汉语拼音字母\/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首\/笔画顺序排列。

中国的汉字如何编码?
B0-F7:汉字区,包含6763个汉字 GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排 序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了 很大作用。GB12345-90 1990年制定了繁体字的编码标准GB12345-90《信息交换用汉字编码字符集 第一辅助 集》...

国标码的全称是什么?
为中国大陆广泛使用。所谓“国标码”,是指国家标准汉字编码。一般是指国家标准局1981年发布的《信息交换用汉字编码字符集(基本集)》,简称GB-2312。在这个集中,收进汉字6763个,其中一级汉字3755个,二级汉字3008个。一级汉字为常用字,按拼音顺序排列,二级汉字为次常用字,按部首排列。

日照市15242502789: 计算机中的汉字编码有哪些? -
禤话恩氟: 根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码. 计算机(computer)俗称电脑,是20世纪最先进的科学技术发明之一,对人类的生产活动和社会活动产生了极其重要的影响并以强大的生命力飞速发展它的应用领域从最...

日照市15242502789: 楷书GB2312 仿宋GB2312 还有几种国标字体 -
禤话恩氟: 系统自带的,有宋、仿、楷、黑,都是.第三方的字体,也有很多,比如方正有GBK字库,有大量的字体.国标字体,准确的名称是GB2312,《信息交换用汉字编码字符集》,是由中国国家标准总局1980年发布,1981年5月1日开始实施的...

日照市15242502789: gb2312是什么意思(字体gb2312是什么意思)
禤话恩氟: GB2312是文字编码的一种,GB2312或GB2312-80是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,又称GB0,由中国国家标...

日照市15242502789: 二进制数汉字编码是什么?
禤话恩氟: 二进制数汉字编码1980年中国为6763个常用汉字规定了编码,称为《信息交换用汉字编码字符集·基本集》,简称GB231280,每个汉字占16位

日照市15242502789: 汉字及其编码 -
禤话恩氟: 所谓编码,是以固定的顺序排列字符,并以此做为记录、存贮、传递、交换的统一 内部特征,这个字符排列顺序被称为“编码”. 字库的编码是字库组织的依据,也是文字处理的基础.不同国家和地区有不同的编 码标准,和中文字库有关的常...

日照市15242502789: 汉字国标GB2312 -
禤话恩氟: GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集——基本集》,由国家标准总局发布,1981年5月1日实施,通行于大陆.新加坡等地也使用此编码.GB 2312中对所收汉字进行了“分区”处理,每区含...

日照市15242502789: 1980年,我国颁布了第一个汉字编码的国家标准: GB2312 - 80 -
禤话恩氟: 区位号(十六进制表示)+20H=国标码(因为国标码从21H开始编) 国标码+80H=机内码,所以机内码总大于A1H “啊”的机内码为B0A1(十六进制) 再减100H即区位码.

日照市15242502789: 《信息交换用汉字编码字符集》是什么码 -
禤话恩氟: 《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980. GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此...

日照市15242502789: 汉字的编码有几种?各有什么用途? -
禤话恩氟: 汉字的编码分为外码、交换码、机内码、字形码和地址码.具体用途如下: 1、外码(输入码) 外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号.常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码...

日照市15242502789: 中文的数字代码 -
禤话恩氟: 这个数字编码简称国标码.以国家标准局1980年颁布的《信息交换用汉字编码字符集》基本集(代号为GB2312-80)规定的汉字交换码作为国家标准汉字编码. GB2312-80中共有7445个字符符号:汉字符号6763个,一级汉字3755个(按汉语...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网