关于python中字符编码的问题

作者&投稿:政薇 (若有异议请与网页底部的电邮联系)
关于java字符编码的问题~

public static void main(String[] args) {

try {
String s1 = new String("张三");
byte b[] = s1.getBytes("UTF-8");
System.out.print(Main.byte2hex(b));
System.out.println(s1);
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
public static String byte2hex(byte[] b) { // 一个字节的数,
// 转成16进制字符串
String hs = "";
String stmp = "";
for (int n = 0; n < b.length; n++) {
// 整数转成十六进制表示
stmp = (java.lang.Integer.toHexString(b[n] & 0XFF));
if (stmp.length() == 1)
hs = hs + "0" + stmp;
else
hs = hs + stmp;
hs=hs+" ";
}
return hs.toUpperCase(); // 转成大写
}

python2.x会存在字符串编码问题

文件开头时加入:# coding:utf-8如果担心不生效,可以强制重置一下:import sysreload(sys)sys.setdefaultencoding("utf8")
变量定义时如果涉及到使用中文时,前面加个'u',表示使用unicode编码
例:str1=u'大家好'
#coding:utf-8import sysreload(sys)sys.setdefaultencoding("utf8")str1 = u"大家好"print str1

你说的是,把字符串:
\u3232\u6674
本身,转换为unicode字符吧?

那么可以通过:
slashUStr = "\\u3232\\u6674";
decodedUniChars = slashUStr.decode("unicode-escape");
print "decodedUniChars=",decodedUniChars; #decodedUniChars= (有) 晴

注:(有) 是个特殊字符,如果想要在cmd(默认为gbk)中打印,会出错的。
UnicodeEncodeError: 'gbk' codec can't encode character u'\u3232' in position 0: illegal multibyte sequence

但是,本身的确已经是转换好了unicode字符串了。

详情可参考:
【整理】Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符

(此处不能贴地址,请用google搜标题,即可找到帖子地址)

a=u'\u6d4b\u8bd5'
print a

关键是加个 u


str在python中是什么意思
Python中的str可以表示字符串类,也可以是将变量强制转换为字符串的函数,写作str()。str函数是Python内置函数的一种,可以直接使用,无需调用。Python由荷兰数学和计算机科学研究学会的Guido van Rossum于1990年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向...

在Python中''是字符串吗?
使用三引号表示多行字符串 string4 = '''This is a multi-line string.'''print(string4)>>> This is a multi-line string.总结起来,单引号和双引号在Python中都可用于表示字符串,没有本质的区别。选择使用哪种引号取决于个人习惯和代码的可读性要求。望采纳!

python变量名可以包含的字符有
变量名不能是Python关键字,但可以包含关键字,变量名不能包含空格。Python变量名是自行定义的,需要使用标识符给变量命名,其实标识符就是用于给程序中变量、类、方法命名的符号。Python语言的变量名必须以字母、下画线(_)开头,后面可以跟任意数目的字母、数字和下画线(_)。此处的字母并不局限于26...

Python如何实现字符串去重操作的代码示例
字符串去重是python中字符串操作常见的一个需求,最近在工作中就又遇到了,所以下面这篇文章主要给大家介绍了关于Python对字符串实现去重操作的相关资料,文中给出了详细的介绍,需要的朋友可以参考借鉴,下面来一起看看吧。前言最近在工作经常会碰到对字符串进行去重操作,下面就给大家列出用Python如何处理的...

python命名规则是什么?
也不像它们的语法那样经常有特殊情况和意外。Python开发者有意让违反了缩进规则的程序不能通过编译,以此来强制程序员养成良好的编程习惯。并且Python语言利用缩进表示语句块的开始和退出,而非使用花括号或者某种关键字。增加缩进表示语句块的开始,而减少缩进则表示语句块的退出。缩进成为了语法的一部分。

python字符串怎么比较大小
Python中比较字符串的大小可以通过直接比较两个字符串来实现。一般来说,Python会按照ASCII码值的大小来比较字符串。答案:在Python中,可以直接使用比较运算符来比较两个字符串的大小。比较时,Python会按照字符的ASCII码值进行比较。详细解释:1. 字符串比较基础:在Python中,字符串是可以进行比较的数据...

python中 字符串是怎么比较大小的
第一个字符相同的情况下,就比第二个字符串,以此类推。举例如下:1、创建python文件,testcompare.py;2、编写字符串比较脚本;print("A"<"B")print("Aa"<"Ab")print("ABC"=="abc")print("abc"=="abc")3、选择‘在终端中运行Python文件’;4、查看执行结果,输出字符串的比较;...

python字符串中字母t出现的次数
这样做就可以查看。dict[i]表示的是字典中字母对应的value(出现次数)dict.get(i,0)+1表示的是从字典获取字母,如果字典中没有查找到对应字母,则将字母i,次数1存入字典。Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计,作为一门叫做ABC语言的替代品。

\\\\t在python中的用法
用于格式化输出和字符串格式化。在Python中,`\\t`表示制表符,用于格式化输出和字符串格式化,使输出更加整洁和易读。制表符长度可变,取决于编辑器或IDE设置。常用于在名称和年龄之间以及行之间创建额外空间,使输出更整齐。在Python中,`\\t`是一个特殊的字符,代表一个制表符(tab字符)。它经常用于...

python中的字典排序如何实现代码说明
这篇文章主要介绍了python字典排序实现方法,实例分析了Python字典排序的相关技巧,需要的朋友可以参考下本文实例分析了python字典排序的方法。分享给大家供大家参考。具体如下:1、 准备知识:在python里,字典dictionary是内置的数据类型,是个无序的存储结构,每一元素是key-value对:如:dict = {'username'...

营山县17524332681: python默认的字符编码是什么 -
左丘馨芬迪: Python的默认编码是ASCII格式:1. ASCII(American Standard Code for Information Interchange),是一种单字节的编码.计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号; 2. 源代码文件中,如果有用到非ASCII字符,则需要在文件头部进行字符编码的声明,如下:#-*- coding: UTF-8 -*- 3. 实际上Python只检查#、coding和编码字符串,其他的字符都是为了美观加上的.另外,Python中可用的字符编码有很多,并且还有许多别名,还不区分大小写,比如UTF-8可以写成u8.

营山县17524332681: 关于python中字符编码的问题 -
左丘馨芬迪: 你说的是,把字符串:\u3232\u6674 本身,转换为unicode字符吧?那么可以通过:slashUStr = "\\u3232\\u6674"; decodedUniChars = slashUStr.decode("unicode-escape"); print "decodedUniChars=",decodedUniChars; #...

营山县17524332681: python2中出现中文字符乱码,怎么处理 -
左丘馨芬迪: 在Python2.x中主要是字符编码的问题,处理不好的话,会导致乱码.Python默认采取的ASCII编码,字母、标点和其他字符只使用一个字节来表示,但对于中文字符来说,一个字节满足不了需求.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网