汉字到底以几进制存储?

作者&投稿:鄢舍 (若有异议请与网页底部的电邮联系)
~
  • 汉字在计算机中的存储方式是采用Unicode编码,Unicode编码是一种字符集,它为每个字符分配了一个唯一的数字编号,这个编号被称为Unicode码点。Unicode码点的范围是0x000000到0x10FFFF,共有1,114,112个码点。

    在计算机中,Unicode编码通常使用UTF-8、UTF-16或UTF-32等编码方式进行存储。UTF-8编码是一种变长编码方式,使用1到4个字节来表示一个字符,其中汉字通常使用3个字节来表示。UTF-16编码是一种定长编码方式,使用2个字节来表示一个字符,其中汉字通常使用2个字节来表示。UTF-32编码是一种定长编码方式,使用4个字节来表示一个字符,其中汉字也使用4个字节来表示。

    因此,汉字在计算机中的存储方式并不是以固定的进制进行存储,而是采用Unicode编码,并使用不同的编码方式进行存储。



存储和表达是两个场景,数据存储从根本上说都是二进制的,不管是内存还是硬盘,存储信息最基本的单元都是许许多多的“位”(bit)就是0、1。
编码是用来表达信息的,表达信息的最基本单元是“字节”,1字节是8位。换句话说,以目前计算机系统设计,小于7位的数据只有逻辑意义(比如电路通断等等低层信息),没有编码意义(字符、文件、图像等高层信息)。十六进制数等于4个二进制数(4bit)。因此1字节数据(8bit)可以表达为2个十六进制数。
英文字符数字标点用8位的普通单字节编码(2个十六进制数,8bit,1字节这三者可以粗略认为是一回事)就可以囊括;汉字数量大,常用字必须用双字节编码(4个十六进制数,16bit,2字节这三者可以粗略认为是一回事)囊括。
之所以书本中强调汉字是使用十六进制表达,是因为在这个语意下,4个十六进制数就不能单纯的看成16位二进制数了,并不是所有任意组合的4个十六进制数(16位二进制数)都能成为汉字编码;汉字只能占据某一段或几段十六进制号码段,其余的号码段是被定义为其他文字或符号的。你细细体会,说“汉字=经过编码的4个十六进制数”和说“汉字=16位二进制数”很明显是不同的,后者的范围就太大了。
希望回答对你有帮助。


计算机中的存储容量以二进制位为单位 对吗?
这句话是正确的。存储容量是指存储器可以容纳的二进制信息量,用存储器中存储地址寄存器MAR的编址数与存储字位数的乘积表示。网络上的所有信息都是以“位”(bit)为单位传递的,一个位就代表一个0或1。一个英文字母就占用一个字节,也就是8位,一个汉字占用两个字节。一般位简写为小写字母“b”,...

二进制文件只能储存数字吗?那字符怎么储存呢??
图形也是二进制形式存储的.如1100001表示97也表示字母a 如1001100100000000表示图象颜色的一个深绿色 资料如下:参考资料:http:\/\/blog.chinaunix.net\/u2\/70445\/showart_1120911.html

存储字长是指什么
而一个存储字可代表一个二进制数,也可代表一串字符。二进制(binary)在数学和数字电路中指以2为基数的记数系统,以2为基数代表系统是二进位制的。这一系统中,通常用两个不同的符号0(代表零)和1(代表一)来表示。数字电子电路中,逻辑门的实现直接应用了二进制,因此现代的计算机和依赖计算机的...

计算机中一个字节由几个二进制位组成
在计算机的世界里,数据的基本单位是二进制,其中最基本的存储单元是字节。一个字节,或者说一个"byte",是由8个二进制位组成的。这是一种常见的计量单位,用来衡量计算机存储容量,也是编程语言中数据类型和字符编码的重要概念。虽然早期的一些计算机系统可能采用不同长度的字节定义,但在现代国际标准中,...

计算机中的字是什么,字符是什么,字节呢?
1、字在计算机中,一串数码作为一个整体来处理或运算的,称为一个计算机字,简称字。字通常分为若干个字节(每个字节一般是8位)。在存储器中,通常每个单元存储一个字,因此每个字都是可以寻址的。字的长度用位数来表示。在计算机的运算器、控制器中,通常都是以字为单位进行传送的。字出现在不同的...

符号、字母、汉字在机内都是以二进制代码形式存储和处理 对还是错_百 ...
所有文件在计算机中都是以二进制代码的形式存储和处理的

请简述为何电脑中文字不能使用8位元来编码。
输入码在计算机中必须转换成机内码,才能进行存储和处理。(3)汉字字形码 为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。全部汉字字码的集合叫汉字字库。汉字库可分为软字库和硬字库。软字库以文件的形式存放在硬盘上,现多用这种方式,硬字库则...

存储数据类型中位,字节,字,双字各有多少位二进制数为
位:一个2进制,值0,1 字节:8个位,最大FF=2^8-1=255;字:2个字节,最大FFFF=2^16-1=65535;双字:2个字,最大FFFFFFFF=2^32-1=4294967295

一个汉字占几个字符
字符串主要用于编程,概念说明、函数解释、用法详述见正文,这里补充一点:字符串在存储上类似字符数组,所以它每一位的单个元素都是可以提取的,如s=“abcdefghij”,则s[1]=“b”,s[9]=&34;,这可以给提供很多方便,如高精度运算时每一位都可以转化为数字存入数组。通常由8个二进制位(一个字节...

字符和字节的关系?
1、字在计算机中,一串数码作为一个整体来处理或运算的,称为一个计算机字,简称字。字通常分为若干个字节(每个字节一般是8位)。在存储器中,通常每个单元存储一个字,因此每个字都是可以寻址的。字的长度用位数来表示。在计算机的运算器、控制器中,通常都是以字为单位进行传送的。字出现在不同的...

丰镇市15247811708: 汉字在数据库中是以二进制形式储存的吗?是如何转换的呢? -
路典祖师: 是的,或者说是十六进制,转换方式你可以对比下1602单色字符显示器,把汉字分解成像素点,每个像素点,对应一个二进制数,1是点亮,0是熄灭,可以想象一下街上的广告牌

丰镇市15247811708: 汉字信息在计算机中通常是以什么形式存储的? -
路典祖师: 所有的信息在计算机内部都是以二进制的形式存储.

丰镇市15247811708: 汉字在计算机内部也用二进制表示吗? -
路典祖师: 都是的,原来用英文表示时,ASCII码是0~127.加上汉字以后,变为0~255.所以汉字也是二进制存储的

丰镇市15247811708: 汉字在计算机中存储用二进制代码? -
路典祖师: 不论是什么,在电脑中存储都是二进制代码 2楼说的有误.汉字不一定用的是Unicode编码.编码有很多种,目前存储汉字用的最普遍的是GB2312码.在GB2312码中,汉字占2个字节,英文、数字(半角的)占一个字节.在Unicode中,通通占两个字节

丰镇市15247811708: 汉字是用啥编码存的? -
路典祖师: 是汉字的输出码,叫做字形码或者字模码.主要是用点阵来存放汉字的形状,一般的是简单字形就16*16点阵,麻烦的汉字就用24*24或者32*32的点阵.每个点用一个二进制单位来存储.如要以汉字库的形式,用来显示或输出的.比如屏幕输出,打印输出等都是用的点阵形式.希望对你能有所帮助.

丰镇市15247811708: 一般情况下,计算机内部储存和处理汉字信息时使用的是A,两个字节的二进制编码 B,十个字节的十进制编码C一般情况下,计算机内部储存和处理汉字信... -
路典祖师:[答案] 当然是A,两个字节的二进制编码.秃子头上的虱子,明摆着的呀.

丰镇市15247811708: 汉字在内存中怎么存 -
路典祖师: 数字1存放就是00000001;字符数字1存放时按ASCII码存放的.汉字一个字是16位2字节.是按Unicode标准转换成相应的码,再转换成二进制存放到内存中.

丰镇市15247811708: 一个汉字是由几个二进制位组成的? -
路典祖师: 不确定,编码不同,长度可能不同. GBK编码里,一个汉字16个二进制.

丰镇市15247811708: 一个字等于32位二进制吗
路典祖师: 不是得,一个汉字为两个字节,跟进制是没有关系的

丰镇市15247811708: 计算机是如何存储文字的 -
路典祖师: 简单的说计算机是用图像的形势储存文字的 电脑中的文字是用点(就是传说中的像素)拼成的,以简易汉字为例,每个简易汉字由256个点拼成,这256个点排列成16*16的矩阵,即每行16个点,每列16个点.其中每个点是黑是白都由一个二进制位来保存.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网