python中unicode编码转换为中文

2022-10-29 16:53:50

我们使用python中,遇到爬取网站情况,用到unicode编码,我们需要将它转换为中文,unicode编码转换为中文的方法有四种:使用unicode_escape 解码、使用encode()方法转换,再调用bytes.decode()转换为字符串形式、 使用json.loads 解码(为json 格式)、使用eval(遇到Unicode是通过requests在网上爬取的时候)。具体内容请看本文。

方法一:使用unicode_escape 解码

unicode = b'\\u4f60\\u597d'
re = unicode.decode("unicode_escape")
print(re)

返回:你好

方法二:使用encode()方法转换,再调用bytes.decode()转换为字符串形式

s = r'\u4f60\u597d'
print(s.encode().decode("unicode_escape"))

方法三: 使用json.loads 解码(为json 格式)

str = '\u4eac\u4e1c\u653e\u517b\u7684\u722c\u866b'
 
print json.loads('"%s"' %str)

方法四:使用eval(遇到Unicode是通过requests在网上爬取的时候)

response = requests.get(url,headers=headers)
re = eval("u"+"\'"+response.text+"\'")
print(re)

关注本地生活,为网民提供最新蕲春新闻、养生保健、美食购物、游戏娱乐,免费发布分类信息、房产信息、招聘信息、求职求购信息等多样性服务,做蕲春最好最大的本地门户网站。

微信公众号

关注我们

Copyright © Hbqc.Ren Inc.All Rights Reserved.鄂ICP备12001991号-13 鄂公网安备42112602000146号