Python写入文件报错‘gbk’ codec can’t encode character的解决办法

news/2024/10/20 0:23:04/

背景

使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题。 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗?不是的。 很多时候,我们使用了decode和encode,试遍了各种编码,utf8,utf-8,gbk,gb2312等等,该有的编码都试遍了,可是编译的时候仍然出现: UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX。 

原因

在windows下面编写python脚本,编码问题很严重。 将网络数据流写入文件时时,我们会遇到几个编码: 1: #encoding='XXX' 这里(也就是python文件第一行的内容)的编码是指该python脚本文件本身的编码,无关紧要。只要XXX和文件本身的编码相同就行了。 比如notepad++ "格式"菜单里面里可以设置各种编码,这时需要保证该菜单里设置的编码和encoding XXX相同就行了,不同的话会报错 2:网络数据流的编码 比如获取网页,那么网络数据流的编码就是网页的编码。需要使用decode解码成unicode编码。 3:目标文件的编码 要将网络数据流的编码写入到新文件,那么我么需要指定新文件的编码。

代码

写入文件代码:

f.write(txt)
那么txt是一个字符串,它是通过decode解码过的字符串。关键点就要来了:目标文件的编码是导致标题所指问题的罪魁祸首。

如果我们打开一个文件,使用如下代码:

f = open("out.html","w")
在windows下面,新文件的默认编码是gbk,这样的话,python解释器会用gbk编码去解析我们的网络数据流txt,然而txt此时已经是decode过的unicode编码,这样的话就会导致解析不了,出现上述问题。

解决的办法就是,改变目标文件的编码:

f = open("out.html","w",encoding='utf-8')

这样,问题将不复存在。

本篇文章如有帮助到您,请给「翎野君」点个赞,感谢您的支持。

首发链接:https://www.cnblogs.com/lingyejun/p/17453258.html


http://www.ppmy.cn/news/203318.html

相关文章

【进阶版】机器学习之支持向量机细节回顾及原理完善(09)

目录 欢迎订阅本专栏,持续更新中~本专栏前期文章介绍!机器学习配套资源推送进阶版机器学习文章更新~点击下方下载高清版学习知识图册支持向量机函数间隔与几何间隔函数间隔几何间隔最大间隔与支持向量从原始优化问题到对偶问题核函数软间隔支持向量机SVM的一些问题如何选择核…

Java 入门教程||Java 泛型||Java 序列化

Java 泛型 概述 泛型在 java 中有很重要的地位,在面向对象编程及各种设计模式中有非常广泛的应用。 什么是泛型?为什么要使用泛型? 泛型,即“参数化类型”。一提到参数,最熟悉的就是定义方法时有形参,然…

Java模式参考大全

Java模式大全 一下模式都在本人博客中有对应的教程,自己搜索 概念 无论承接什么样的需求,是不是身边总有那么几个人代码写的烂,但是却时常有测试小姐姐过来聊天(求改bug)、有产品小伙伴送吃的(求写需求)、有业务小妹妹陪着改代码(求上线),…

3D手机虚拟现实眼镜大全

日期:2015-01-12 真实幻觉(Virtual Reality,简称VR,又译作灵境、幻真)是近年来出现的高新技术,也称灵境技术或人工环境。虚拟现实是利用电脑模拟产生一个三维空间的虚拟世界,提供使用者关于视觉、听觉、触觉等感官的模…

Photoshop快捷键大全

Photoshop快捷键大全 - 1、工具箱 (多种工具共用一个快捷键的可同时按【Shift】加此快捷键选取) 矩形、椭圆选框工具 【M】 裁剪工具 【C】 移动工具 【V】 套索、多边形套索、磁性套索 【L】 魔棒工具 【W】 喷枪工具 【J】 画笔工具 【B】 像皮图章、图案图章 【S】 历史记…

团队建设游戏大全

团队建设游戏大全 目 录 沟通 我的期望我是记者生日线撕纸三分钟测试猜名人游戏空方阵 团队建设 迷失丛林蜘蛛网电网小泰山全体离地核弹头 信 任 风中劲草信任空中飞人信任百步行 创造力 呼啦圈高空飞蛋建大桥建塔飞行器 领导力 建绳房他的授权方式个人发展盾形图 破 冰 踩轮…

Unity分屏之使用TUIO实现互动投影

“两个屏幕,一个主屏幕(显示器),一个投影屏幕(地幕投影或者墙面投影)。可以触控投影屏幕来与主屏幕做交互” 针对以上这个需求,本篇文章主要讲两个内容: 1.Unity项目分屏 2.Unity项…

大学计算机技术知识大全,大学计算机全章节重点基础知识归纳大全.doc

大学计算机全章节重点基础知识归纳大全 PAGE \* MERGEFORMAT 18 大学计算机基础重点归纳 第一章:计算机概论 19646年,第一台计算机,ENIAC 计算机分类(6):巨型,小巨型,大型主机,小型机&#xff0…