报错'gb2312' codec can't decode byte 0x9e in position 4100: illegal multibyte sequence,“gb2312”编解码器无法解码位置4100中的字节0x9e:非法的多字节序列

风花雪月
• 阅读 2160

“gb2312”编解码器无法解码位置4100中的字节0x9e:非法的多字节序列。

处理方式: with open(path, encoding="utf8", errors='ignore') as f:

使用errors='ignore'去掉(忽略)字符并返回不带字符的字符串。

点赞
收藏
评论区
推荐文章
Stella981 Stella981
3年前
Python中文转换报错 'ascii' codec can't decode byte 0xe8 in position
 脚本报错:!(https://oscimg.oschina.net/oscnet/5b8eaa4be291c9583f3fac05a59733caabf.png)脚本代码:!(https://oscimg.oschina.net/oscnet/3bbeff251f60674ece9d67de1e68463fbb1.png)报错原因:
Stella981 Stella981
3年前
Python Challenge Level 18
初学Python,挑战一下流行的PythonChallenge,很不幸,卡在了18关~~被字符字节码之间的转换搞得焦头烂额,不过终于搞定了还是很happy的~~~主要的问题就是16进制形式的字符如何转成字节码(注意:不是encoding)如:\'89','50','4e','47','0d','0a','1a','0a','00
Stella981 Stella981
3年前
Django基础介绍
Djangoweb应用的本质socket网络编程:​架构:C/S架构​协议:TCP/UDP协议​传输层web应用:​架构:B/S架构​协议:Http协议​应用层字符串转字节:bytes('hfihajfaiuu',encoding'utf8')字节转字符串:str(res,
Stella981 Stella981
3年前
Node.js 12中的ES模块[每日前端夜话0x9E]
每日前端夜话0x9E每日前端夜话,陪你聊前端。每天晚上18:00准时推送。正文共:2552字预计阅读时间:10 分钟作者:BrianDeSousa翻译:疯狂的技术宅来源:logrocket!(https://oscimg.oschina.net/oscnet/2ccaf94cecd3
Wesley13 Wesley13
3年前
PHP 截取字符串
1.截取GB2312中文字符串<?php//截取中文字符串functionmysubstr($str,$start,$len){$tmpstr"";$strlen$start$len;for($i0;
Stella981 Stella981
3年前
PHP检测当前字符编码并转码
一、检测当前字符串编码并将编码改为utf81获取当前字符串的编码$encodemb\_detect\_encoding($str,array("ASCII",'UTF8',"GB2312","GBK",'BIG5')); 2将字符编码改为utf8$str\_encodemb\_convert\_encoding($st
Wesley13 Wesley13
3年前
JAVA NIO 字符集编码问题
字符集是非英语国家人最头疼的事情,尤其是样样有国标的中国。所以本朝的码农比洋大人程序员学各种技能都要多会一个技能点——应付编码问题。NIO我们同样需要面对编码解码问题。六、字符集:CharSet编码:字符串字节数组解码:字节数组字符串有哪些编码呢?@Testp
Wesley13 Wesley13
3年前
VC++中关于TCHAR,WCHAR,LPSTR,LPWSTR,LPCTSTR的解释
一般来说,一个字符(character)占用1字节或是2字节,我们说1字节的字符是ANSI,他可以用来表示英语字母,而2字节的我们称之为Unicode,可以表示世界上所有的语言。。VC使用char和wchar\_t的内置数据类型来分别作为表示ANSI和Unicode字符。如果你想让你的C/C程序是字符集无关的,该怎么做呢?如果你用通
Stella981 Stella981
3年前
Python爬虫初学
学习爬虫中,从最近自己写的爬虫小程序中抓截一点代码。加深下记忆。1.因为我已经安装了Python3,所以使用了urllib3库。2.要根据对应网页的数据格式进行解码,有的是utf8,有的是GB2312,当然可能还有其它。否则会报错。import urllib3import time因为我使用了Python3,所以使用urlli
Stella981 Stella981
3年前
Mybatis初学时遇到的错误
错误一:com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException:3字节的UTF8序列的字节2无效。解决:我的项目是Maven构建的,所以在项目依赖配置文件pom.xml上加入构建项目编码属性:<proper