一个汉字占几个字符?

作者&投稿:诗侧 (若有异议请与网页底部的电邮联系)
字节、字符的区别,一个汉字是占两个字节还是两个字符?~

一个汉字占2个字节。
字节(Byte):字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位。字节是计算机信息技术用于计量存储容量和传输容量的一种计量单位,1个字节等于8位二进制,它是一个8位的二进制数,是一个很具体的存储空间。
字符:计算机中使用的字母、数字、字和符号,包括:1、2、3、a、b、c、~!•#¥%……—*()——+等等,相当于这些东西的统称。所以,1个汉字字符会占用两个英文字符的位置,存储需要2个字节;1个英文字符存储只占一个英文字符的位置,存储需要1个字节;2个数字为一个字节。

不同数量级间
信息存储量是度量存储器存放程序和数据的数量。其主要度量单位是字节,1个字节(Byte)等于8位(b)二进制。位(bit,Binary Digits):存放一位二进制数,即0或1,为最小的存储单位,8个二进制位为一个字节单位。一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。英文标点占一个字节,中文标点占两个字节。
以上内容参考:百度百科-字节

word中,一个汉字相当2个ASCII 字符。
word中,一个汉字是相当于2个字符。
在中文编辑状态下,在设置段落时,首行缩进2个字符,这吋缩进的是指2个汉字,这是按中文的书写习惯。
以占用空间而言,在保存word文档时,一个汉字占用2个ASCII 码字符的空间。

如果你说的“字符”就是指 Java 中的 char,那好,那它就是 16 位,2 字节。

如果你说的“字符”是指我们用眼睛看到的那些“抽象的字符”,那么,谈论它占几个字节是没有意义的。具体地讲,脱离具体的编码谈某个字符占几个字节是没有意义的。

就好比有一个抽象的整数“42”,你说它占几个字节?这得具体看你是用 byte,short,int,还是 long 来存它。
用 byte 存就占一字节,用 short 存就占两字节,int 通常是四字节,long 通常八字节。
当然,如果你用 byte,受限于它有限的位数,有些数它是存不了的,比如 256 就无法放在一个 byte 里了。

字符是同样的道理,如果你想谈“占几个字节”,就要先把编码说清楚。同一个字符在不同的编码下可能占不同的字节。

就以你举的“字”字为例,“字”在 GBK 编码下占 2 字节,在 UTF-16 编码下也占 2 字节,在 UTF-8 编码下占 3 字节,在 UTF-32 编码下占 4 字节。不同的字符在同一个编码下也可能占不同的字节。

“字”在 UTF-8 编码下占3字节,而“A”在 UTF-8 编码下占 1 字节。(因为 UTF-8 是变长编码),而 Java 中的 char 本质上是 UTF-16 编码。而 UTF-16 实际上也是一个变长编码(2 字节或 4字节)。

如果一个抽象的字符在 UTF-16 编码下占 4 字节,显然它是不能放到 char 中的。换言之, char 中只能放 UTF-16 编码下只占 2 字节的那些字符。而 getBytes 实际是做编码转换,你应该显式传入一个参数来指定编码,否则它会使用缺省编码来转换。

你说“ new String("字").getBytes().length  返回的是3 ”,这说明缺省编码是 UTF-8.
如果你显式地传入一个参数,比如这样“ new String("字").getBytes("GBK").length ”,那么返回就是 2。你可以在启动 JVM 时设置一个缺省编码,假设你的类叫 Main,那么在命令行中用 java 执行这个类时可以通过 file.encoding 参数设置一个缺省编码。
比如这样:java -Dfile.encoding=GBK Main
这时,你再执行不带参数的 getBytes() 方法时,new String("字").getBytes().length  返回的就是 2 了,因为现在缺省编码变成 GBK 了。
当然,如果这时你显式地指定编码,new String("字").getBytes("UTF-8").length  返回的则依旧是 3.

否则,会使用所在操作系统环境下的缺省编码。

通常,Windows 系统下是 GBK,Linux 和 Mac 是 UTF-8.
但有一点要注意,在 Windows 下使用 IDE 来运行时,比如 Eclipse,如果你的工程的缺省编码是 UTF-8,在 IDE 中运行你的程序时,会加上上述的 -Dfile.encoding=UTF-8 参数,这时,即便你在 Windows 下,缺省编码也是 UTF-8,而不是 GBK。

由于受启动参数及所在操作系统环境的影响,不带参数的 getBytes 方法通常是不建议使用的,最好是显式地指定参数以此获得稳定的预期行为。



这个与采用的编码有关,GBK\GB2312编码是2个字节,但是unicode\utf-8等就不同了,这些编码里面汉字是长度不是一定的,有的长、有的短,2~4字节。

一般来说:GBK\GB2312编码是2个字节,但是unicode\utf-8编码是3个字节。

是字节吧!一个汉字占两个字节。

没有占用几个字符这种说法,只有占用几个字节这种说法,不同的编码方式占用的字节数不一样。例如utf-8一般一个汉字占 3 个字节(不固定),gbk占两个字节。

ps:一个字符(char)占用一个字节




一个汉字等于几个字符?
一个汉字等于2个字符。在 ASCII 编码中,一个英文字母字符存储需要1个字节。在 GB 2312 编码或 GBK 编码中,一个汉字字符存储需要2个字节。在UTF-8编码中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3到4个字节。在UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个字节(U...

一个汉字几个字符?
一个汉字等于2个字符。在 ASCII 编码中,一个英文字母字符存储需要1个字节。在 GB 2312 编码或 GBK 编码中,一个汉字字符存储需要2个字节。在UTF-8编码中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3到4个字节。在UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个字节(U...

一个汉字在内存中占多少字节?
一般占用两个字节。1个ASCII码占1个字节,而1个汉字编码占2个字节。这是指汉字编码,就象每个字符都有一个ASCII码一样。如果是在UTF-8编码下,一个汉字占3个字节,UTF-8是一种国际通用的一种变长编码。西方文字(希腊文字)占2个字符,中文占用3个字节数,还有平面符号占4个字节。汉字,又称中文...

一个汉字占几个字节?
汉字两个字符,西文一个字符,汉字第一个字符的第一位必须为1.所以ABF4D1E3C2B7是汉字,78、55是西文。ASCII码:一个英文字母(不论大小写)占用一个字节的空间。一组二进制数字,在计算机中用作数字单位,通常为8位。转换为小数,最小值为-128,最大值为127。例如,ASCII码是一个字节。UTF-8编...

一个汉字几个字符
2个。一个汉字在计算机中占用两个字符位置,也就是两个字节。这是因为汉字的编码方式采用了双字节编码,例如常用的GBK、UTF-8等编码方式。

一个汉字有几个字符?
一个汉字就是一个字符,但它占用了两个英文字符的空间(两个字节) 在unicode中,一个汉字是4个字节,英文字符是2个字节。请注意"字符"和"字节"两个术语的是不同的。在我们常见的GB2312和GBK字符集中,一个汉字是两个字节,ANSI字符集中,一个英文字符是一个字节。在计算机和电信技术中,一个字符...

一个汉字到底是多少个字符,高手请进
一个汉字占用2个字符。在 ASCII 编码中,一个英文字母的字符存储需来要1个字节。在 GB 2312 编码或 GBK 编码中,一个汉字字符自存储需要2个字节。在UTF-8编码中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3到4个字节。在UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个...

一个简体字是多少字符???256个字符是几个汉字?
一个汉字占两个字节(字符),256个字节(字符)也就是128个字了。

一个汉字占几个字符
在UTF-8编码下,一个汉字占用3个字节。字节(Byte)是计算机信息技术用于计量存储容量的一种计量单位,也表示一些计算机编程语言中的数据类型和语言字符。UTF-8,是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符...

word中一个汉字等于几个字符呢?
word中,一个汉字相当2个ASCII 字符。word中,一个汉字是相当于2个字符。在中文编辑状态下,在设置段落时,首行缩进2个字符,这吋缩进的是指2个汉字,这是按中文的书写习惯。以占用空间而言,在保存word文档时,一个汉字占用2个ASCII 码字符的空间。

娄底市17614608726: 一个汉字等于几个字符 -
甫菁扶达:[答案] 一个汉字等于两个字符

娄底市17614608726: 一个汉字等于2个字符吗?
甫菁扶达: word中,一个汉字是相当于2个字符.在中文编辑状态下,在设置段落时,首行缩进2个字符,缩进的是指2个汉字,这是按中文的书写习惯.以占用空间而言,在保存word文档时,一个汉字占用2个ASCII码字符的空间.在UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节).在UTF-32编码中,世界上任何字符的存储都需要4个字节.计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码.

娄底市17614608726: 一个汉字多少个字符?? -
甫菁扶达: Word里面一个字符就是一个汉字. 1GB=1000MB 1MB=1000KB 1KB=1000B通常情况下,把B称为字节、b称为字位、KB称为千字节、MB称为兆字节、GB称为吉字节.

娄底市17614608726: word中一个汉字等于几个字符呢? -
甫菁扶达: word中,一个汉字相当2个ASCII 字符. word中,一个汉字是相当于2个字符. 在中文编辑状态下,在设置段落时,首行缩进2个字符,这吋缩进的是指2个汉字,这是按中文的书写习惯. 以占用空间而言,在保存word文档时,一个汉字占用2个ASCII 码字符的空间.

娄底市17614608726: 一个汉字是多少字符,210个字符等于多少个汉字呀? -
甫菁扶达:[答案] 是指网站网页行业中吗? 那么一个汉字相当于两个字符,一个字母是一个字符,210个字符等于105个汉字

娄底市17614608726: 一个汉字等于多少个字符? -
甫菁扶达: 1G=1024MB 1MB=1024KB 1KB=1024B 1B=8bit 一个汉字=2B 一个英文=1B B就是字节的意思. KB千字节 MB兆

娄底市17614608726: 字串长度,至少为一个字符. -
甫菁扶达:[答案] 一个汉字占2个字符,标点占1个字符 全角占两个字节,半角占一个字节. 半角全角主要是针对标点符号来说的,全角标点占两个字节,半角占一个字节,而不管是半角还是全角,汉字都还是要占两个字节. 比如: ,.'!……这些是半角的 ,.'!……这...

娄底市17614608726: 汉字不是占两个字符吗? -
甫菁扶达:[答案] 汉字不一定占几个字符,这个得看编码格式,GB2312和UTF-8还是其他编码. 有一些编码格式是定长的,也就是所有的字符都是一样 的长度. 但是有一些编码格式是变长的,也就是开始的字符占2个字节,2个字节不够用了,就用4个字节.这时候字符...

娄底市17614608726: 计算机中一个汉字等于几个字符 -
甫菁扶达: 2个

娄底市17614608726: word里一个字占几个字符 -
甫菁扶达: 英文1个 汉字2个 编程语言中一个汉字是2个字节 字节(Byte):通常将可表示常用英文字符8位二进制称为一字节.一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间. 符号:英文标点2占一个字节,中文标点占两个字节.一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,如一个ASCII码就是一个字节,此类单位的换算为: 1千吉字节(KGB,KiloGigaByte)=1024吉字节 1吉字节(GB,GigaByte) =1024兆字节 1兆字节(MB,MegaByte) =1024千字节 1千字节(KB,KiloByte) =1024字节 1字节(Byte) = 8位(bit)

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网