关于UCS2(Unicode) 转换为 UTF-8编码的疑问

作者&投稿:农蓝 (若有异议请与网页底部的电邮联系)
ucs2和 unicode是一样的吗~

Unicode也是一种字符编码方法 简称为UCS
UCS2是Unicode的一种
UCS2码中每个字符都占两个字节
Unicode中包括UCS2 UCS4

一、主体不同
1、UTF-8 GBK :中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式。
2、UTF8 GB2312: 是基于 1980 年发布的《信息交换用汉字编码字符集基本集》,是中文信息处理的中国国家标准,是强制执行的中文编码。
二、特点不同
1、UTF-8 GBK :向下与 GB 2312 编码兼容,向上支持 ISO 10646.1国际标准,是前者向后者过渡过程中的一个承上启下的产物。
2、UTF8 GB2312:共收录 6763 个简体汉字、682 个符号,其中汉字部分:一级字 3755 个,以拼音排序,二级字 3008 个,以偏旁部首排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。


三、字节数不同
1、UTF-8 GBK :是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字,完全兼容GB2312-80标准。
2、UTF8 GB2312:标准涵盖了单字节、双字节、四字节的字符和汉字,共计约 28,000 多个。

参考资料来源:百度百科-GBK字库
参考资料来源:百度百科-仿宋_GB2312

你的程序得到的UTF8字符串为止,都是对的,只是最后的UTF8的输出顺序错了。

正确的输出顺序是:

E8AF 95E9 8CAA

而E8AF95是“试”字,E98CAA是“验”字。

UTF8字串顺序是CHAR队列C1 C2 C3 C4...,
你强制成WCHAR输出时,顺序变成了 C2 C1 C4 C3...


python中unicode编码有多少位(2023年最新分享)
至于python里的unicode到底是ucs2还是ucs4的,可以在编译时指定。例如Linux下,要用ucs2做unicode的编码,可以这样 #.\/configure--enable-unicode=ucs2 #make #makeinstall 下载的Windows预编译版本,一般都是ucs2的。要想知道某个python运行环境是ucs2还是ucs4,可以查看sys.maxunicde,65535就是ucs2的,另一个很大的数值就...

python中string和Unicode的区别
至于python里的unicode到底是ucs2还是ucs4的,可以在编译时指定。例如Linux下,要用ucs2做unicode的编码,可以这样 .\/configure --enable-unicode=ucs2 make make install 下载的Windows预编译版本,一般都是ucs2的。要想知道某个python运行环境是ucs2还是ucs4,可以查看sys.maxunicde,65535就是ucs2的,另...

为什么电脑下载的小说在手机上不能看
手机不支持小说的文件格式,建议下载手机小说阅读器 编码方式不同,我们电脑中常规用的是ansi编码,但手机就不同了,手机一般默认的是unicode编码,编码不认的情况下会出现乱码。txt电子书制作最简单的,将常规编码的电子资料“另存为”的时候将编码改成unicode编码形式的即可。电脑下载的小说会多种格式,P...

我的Adobe删除不了
应当不会这样啊。看看进程中有无相关升级或服务(按理说不该有),或在安全模式下,用“冰刀”强删 拔掉网线,进入安全模式删;或下载IceSword120_cn“冰刀”,肯定能删除

汕头市19858666083: UCS2如何转换成UCS4 -
庄育清蒙: UCS2认为每个字符占用2个字节,UCS4认为每个字节占用4个字符,都是UNICODE的编码形式.在由UCS2转到UCS4时,每次读取4个字节为一个字符,由于UNICODE向下兼容,再查UNICODE表得对应字符,直到读到0x00000000为止.国...

汕头市19858666083: 急救:UCS2转化为十六进制字符串问题 -
庄育清蒙: 你不是已经给DestBuf赋值了吗? for (i=0;i { DestBuf[j++] = wcbuf[i]>>8; /* height byte */ DestBuf[j++] = wcbuf[i]&0xff; /* low byte */ } 有问题吗? 你是不是要这个结果: char s[1000]; for(int k = 0; k{ sprintf(&s[2*k],"%02X",DestBuf[k]); }s[2*k] ='\0';

汕头市19858666083: 怎么把UCS2编码转成UTF - 8的 -
庄育清蒙: 安全起见 记事本一个一个的打开文件修改GB2312为UTF-8 CODEPAGE="936"为 CODEPAGE="65001" 另存为 选择 UTF-8的编码 然后用Dreamweaver打开(Dreamweaver已经默认编码是UTF-8的) 然后修改里面的文字 保存一下就可以了

汕头市19858666083: java中ucs2的可用名称 -
庄育清蒙: UCS2 是Unicode 的编码格式,是用两个字节表示Unicode的.中文GBK、GB2312、UTF-8,这些是

汕头市19858666083: 在vc6的运行环境下用c语言调用mysql查询语句后返回的汉字显示乱码,有什么办法吗? 注:在my -
庄育清蒙: 这是因为UTF8编码格式的问题,你需要进行字符转换.首先用MultiByteToWideChar(CP_UTF8,0,lpszBuffer,-1,(LPWSTR)pUnicode,size); 把UTF8转成宽字节文字,然后用WideCharToMultiByte(936,0,(LPWSTR)pUnicode,-1,lpszContext,size,...

汕头市19858666083: GSM短信模块怎样发汉字? -
庄育清蒙: 短信模块G100可以中英文混发,虽然GSM模块里没有汉字的概念,但是所有汉字都可以转为2个字节的unicode编码,如“捷麦”是用“63H 77H 91H A6H”来表示,就好比英文字母和数字要用ASCII来表示才能被计算机识别一样.在短信模块中英文字母,数字,以及一些特殊符号也都转换为相应的unicode编码,所以我们要把发送的短信全部转换成unicode编码存放在EEPROM或其他存储器里,用到的时候调出来通过串口发送出去即可.

汕头市19858666083: python是enable - unicode = ucs2怎么变成enable - unicode = ucs4 -
庄育清蒙: 以 --enable-unicode=ucs4 编译则:>>> import sys>>> print sys.maxunicode1114111 以 --enable-unicode=ucs2 编译则:>>> import sys>>> print sys.maxunicode

汕头市19858666083: 如何实现Unicode和ANSI编码格式字符串的相互转换 -
庄育清蒙: 1、工具→选项→常规→Web 选项→编码→“将此文档另存为”下拉框里选择您希望的编码方式,点击两次“确定”,最后保存. 2、Alt+X 指定的(十六进制)Unicode 字符代码对应的 Unicode 字符.例如,若要插入欧元货币符号()

汕头市19858666083: ucs2和 unicode是一样的吗 -
庄育清蒙: Unicode也是一种字符编码方法 简称为UCS UCS2是Unicode的一种 UCS2码中每个字符都占两个字节 Unicode中包括UCS2 UCS4

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网