关于计算机汉字的编码,计算机中的汉字库中大概有多少个?

作者&投稿:禽桂 (若有异议请与网页底部的电邮联系)
计算机中编码存储的汉字有多少个~

1.每个英文字符对应一个字节----这就是ASCII码,如31-'1',41-'A','61'-'a'.美国人定的标准.
2.汉字采用2字节编码(现在不完全准确),国家制定.现在的标准是GB18030,早期是GB2312-80.前者含盖后者.
3.一个字节是8位,ASCII码最高位是'0'(所以最多128个编码).
4.汉字将最高位置为'1',与ASCII码(英文符号)区隔开.
5.软件当读取一个字节时,先判断最高位是否为'0'.若是,则作英文符号处理;若不是,再读取下一个字节,两个字节合一处对应一个汉字.如,B0A1-'啊',D5FE-'政'.
6.无论是ASCII码还是汉字编码,相当于身份证号.实际显示出的汉字要到一个叫"汉字模库'的文件中提取,它的位置与编码有相对应的关系.

根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码。

计算机(computer)俗称电脑,是20世纪最先进的科学技术发明之一,对人类的生产活动和社会活动产生了极其重要的影响并以强大的生命力飞速发展它的应用领域从最初的军事科研应用扩展到社会的各个领域,已形成了规模巨大的计算机产业带动了全球范围的技术进步由此引发了深刻的社会变革计算机已遍及一般学校企事业单位。
计算机的应用在中国越来越普遍改革开放以后中国计算机用户的数量不断攀升特别是互联通通信多媒体等领域的应用取得了不错的成绩1996年至2009 年计算机用户数量从原来的630万增长至6710 万台联网计算机台数由原来的2.9万台上升至5940万台。
互联网用户已经达到3.16 亿无线互联网有6.7亿移动用户其中手机上网用户达1.17 亿为全球第一位。

电脑汉字的编码,电脑汉字库中的汉字数量由字符集决定的,GB2312的字符集约6000多,GBK约1-2万,GB18030约6万。
电脑内部汉字信息的存储运算的代码有四种:输入码、国标码、内码和字型码。
输入码:包括拼音编码和字型编码。微软拼音ABC就是拼音编码,五笔字型输入法就是字型编码。
国标码:又称为汉字交换码,在计算机之间交换信息用。用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为2的14次幂,就是16384个。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。例如“中”字的国标码为8680(十进制)或7468(十六进制)。
内码:汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128(十进制)或80(十六进制)。例如,“中”字的内码以十六进制表示时应为F4E8。这样做的目的是使汉字内码区别于西文的ASCII,因为每个西文字母的ASCII的高位均为0,而汉字内码的每个字节的高位均为1。
字型码:表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式。通常用点阵、矢量函数等表示。用点阵表示时,字形码指的就是这个汉字字形点阵的代码。根据输出汉字的要求不同,点阵的多少也不同。简易型汉字为16′16点阵、提高型汉字为24′24点阵、48′48点阵等。如果是24′24点阵,每行24个点就是24个二进制位,存储一行代码需要3个字节。那么,24行共占用3′24=72个字节。计算公式:每行点数/8′行数。依此,对于48′48的点阵,一个汉字字形需要占用的存储空间为48/8′48=6′48=288个字节。

汉字库有多少个。“字库”这个说法比较含糊,可能涉及字符编码、字符集、字体文件等多个概念。
说说几点
1、汉字的字体支持多少个,由具体的字体文件的内容决定。比如现在的win自带的简体楷体simkai,只支持gb2312的6000多个汉字,用做unicode时,也只支持其中的6000个字符,繁体字就不会显示。简体宋体支持1万多个汉字。
2、汉字编码支持多少个汉字由字符集决定。gb2312的字符集约6000多,gbk约1-2万,gb18030约6万。
3、字符集不等于编码。unicode字符集现在已经达到11万多个字符。把unicode转换成机内码有的多种编码,utf7,8,16,32等等。其中你说的2个字节的unicode,是早期的unicode2.0版,现以被淘汰的一种UTF16格式,又叫UCS-2. 比较有名的用例是Java和C的wchar。现行的UTF-16每个字符输出2或4个字节。4个字节下可以支持的字符数量将上亿,不用担心不够码位codepoint的问题。

不同级别的标准,汉字库的数量也有所不同。
按照GB2312,其规定的汉字库包含6763个常用汉字。
到了GB18030,其规定的汉字库已大幅扩充到70244个(其实不仅仅是“汉”字,很多少数民族的文字也已经归纳并收集入此版本的库中)。


属于汉字编码的是
1、机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。2、通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。3、通过汉字编码输入:根据一定的编码方法,由人借助...

汉字编码分类
理想的输入码应具备简单易学、操作便捷、重码率低和输入速度快等特点,用户可以根据个人喜好选择。本书后续章节将详细介绍智能全拼输入法和五笔字型输入法这两种常见的输入方式。交换码,即国标码,是在计算机内部处理汉字时使用的标准。中国国家标准GB2312--80于1981年发布,规定了信息交换中汉字的编码。

计算机内部处理汉字的编码称为
计算机内部处理汉字的编码称为机内码。汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统...

汉字的编码包括输入码机内码输出码的
例如,点阵字形码就是用点阵表示汉字的字形,它把汉字按字形排列成点阵,常用点阵有16×16,24×24,32×32或更高。汉字编码系统的发展是随着计算机技术的进步而不断完善的,从最初的简单编码到现在更为复杂且功能强大的编码系统,其目的都是为了能够在计算机中更为高效地处理和显示汉字。

汉字在计算机中的储存代码是什么
国标码:按国际标准制定的汉字和符号的交换码,国标GB2312-80中收录了7445个汉字及字符,根据每一个字符的特点和位置,所有字符分为94个区、94个位。把区位码区和位分别转换成十六进制数,然后+2020H就是国标码 汉字的内部码:也称(机)内码。是计算机内处理汉字信息时所用的汉字代码 内码=国标码+...

汉字国标码(gb2312-80)把汉字用几个字节表示
支持更多的汉字和字符。目前,GB18030已经成为中国大陆地区的主要汉字编码标准。总之,汉字国标码(GB2312-80)是一种把汉字用两个字节表示的编码标准,它在计算机系统中的应用具有重要的历史意义。虽然后来出现了一些新的编码标准,但GB2312-80仍然在一些特定的场合发挥着作用。

计算机内部使用的汉字编码
计算机内部使用的汉字编码称为汉字内码或汉字机内码。汉字机内码由国标码(GB2312-80)演化而来,把表示国际码的两个字节的最高位分别加1,就变成了汉字机内码。汉字字模信息码即汉字字形码,用点阵方式来构造汉字字型。它们的关系是这样的,汉字输入编码是外部码,同一个汉字可以有不同的输入编码,但...

汉字在计算机内的表示方法一定是
汉字在计算机内的表示方法是:Unicode编码系统和GBK编码系统。

计算机内部处理汉字所采用的编码形式是ascii还是机内码啊?
电脑内部处理汉字所采用的编码形式是机内码。大部分电脑要用于信息管理,因此,需要把有关的信息进行二进制编码。国际上通用的是ASCII码,即美国标准信息交换码,它用七位二进制编码来表示十进制数、英文字母和常用符号,如运算符、括号、标点符号、标识符等,还有一些控制符,一共可以表示128个字符。其中...

关于计算机汉字的编码,计算机中的汉字库中大概有多少个?
电脑汉字的编码,电脑汉字库中的汉字数量由字符集决定的,GB2312的字符集约6000多,GBK约1-2万,GB18030约6万。电脑内部汉字信息的存储运算的代码有四种:输入码、国标码、内码和字型码。输入码:包括拼音编码和字型编码。微软拼音ABC就是拼音编码,五笔字型输入法就是字型编码。国标码:又称为汉字...

东台市13140336936: 计算机中常见的汉字编码有哪些? -
资袁赛奇:[答案] 根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码. 1.外码(输入码) 外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号.目前常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位...

东台市13140336936: 2.汉字在计算机系统中使用的编码是( ). -
资袁赛奇:[选项] A. 输入码 B. 机内码 C. 国标码 D. 点阵码

东台市13140336936: 关于计算机汉字的编码,计算机中的汉字库中大概有多少个? -
资袁赛奇: 电脑汉字的编码,电脑汉字库中的汉字数量由字符集决定的,GB2312的字符集约6000多,GBK约1-2万,GB18030约6万. 电脑内部汉字信息的存储运算的代码有四种:输入码、国标码、内码和字型码. 输入码:包括拼音编码和字型编码.微...

东台市13140336936: 计算机中的汉字编码有哪些? -
资袁赛奇: 根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码. 计算机(computer)俗称电脑,是20世纪最先进的科学技术发明之一,对人类的生产活动和社会活动产生了极其重要的影响并以强大的生命力飞速发展它的应用领域从最...

东台市13140336936: 计算机中对汉字进行统一编码,我国对汉字编码采用的是 -
资袁赛奇:[选项] A. 汉字国标码 B. 汉字字形码 C. 汉字电报码 D. 汉语拼音码

东台市13140336936: 汉字的编码有几种?各有什么用途? -
资袁赛奇: 汉字的编码分为外码、交换码、机内码、字形码和地址码.具体用途如下: 1、外码(输入码) 外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号.常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码...

东台市13140336936: 汉字在计算机系统中存储所用的编码是什么 -
资袁赛奇: GB国标码:中文内码之一,代表中文简化字,在中国大陆广泛使用,影响所及,使用量渐见普及. “国家标准信息交换用汉字编码”(GB2312-80标准),简称国标码.国标码是指1980年中国制定的用于不同的具有汉字处理功能的计算机系统间交换汉字信息时使用的编码.国际码是二字节码, 用两个七位二进制数编码表示一个汉字.目前国标码收入6763个汉字, 其中一级汉字(最常用)3755个, 二级汉字3008个, 另外还包括682个西文字符、图符.

东台市13140336936: 在计算机中,汉字系统把一个汉字表示为 - -------. -
资袁赛奇: 在计算机中,汉字系统把一个汉字表示为两个字节的二进制编码. 简体中文常见的编码方式是 GB2312,使用两个字节表示一个汉字.一个字节只能表示256种符号,肯定是不够的,就必须使用多个字节表达一个符号.所以最多可以表示 256 ...

东台市13140336936: 计算机中目前最普遍使用的汉字字符编码是什么 -
资袁赛奇: 计算机中目前最普遍使用的汉字字符编码是ASCII码. ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符.标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网