我们的python在爬虫或web中,默认是不需要我们获取进行编码和解码的
因为框架自动帮我们编码然后返回给我们,但是一般用的都是UTF-8,如果这个数据的编码方式是unicode-escape怎么办呢,那么我们就会获得一堆类似于"\u4e00"这样的字符串
解决办法:
unicode_str = '\\u4e00'
str_a = unicode_str.encode().decode("unicode-escape")
# 此时stra就是我们的中文字符了
# 先用UTF-8编码方式将其转换回字节码,然后再用正确的对应的编码转回来
如果我们获得的是’\u4e00’这样的字符串,那么不用转换,存储的时候以utf-8存储即可
with open('test.txt','w',encoding='utf-8') as f:f.write("\u4e00")