Python代码解压的中文文件名是乱码,怎么解决?

Python进阶者
• 阅读 169

大家好,我是Python进阶者。

一、前言

前几天在Python白银交流群【fashjon】问了一个Python自动化办公的问题,问题如下:

import zipfile

def unzip_file(zip_file_path, output_folder_path):
    with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
        zip_ref.extractall(output_folder_path)

# 使用示例
zip_file_path = 'example.zip'
output_folder_path = 'output_folder'
unzip_file(zip_file_path, output_folder_path)

以上代码解压的中文文件名是乱码,怎么解决?

二、实现过程

这里【瑜亮老师】给了个思路如下:乱码是什么样子的?最好能传上来一个压缩包,我们好试验。

过了几分钟,【瑜亮老师】补充道:@fashjon 我查看了一下zipfile的源码,发现是使用了'cp437'编码了文件名才导致的文件名错误。既然知道了错误的编码,那么方法就很简单了,1修改源码,2自己写代码读取解压缩路径中的文件名,重新使用'cp437'编码然后用gbk解码,重命名文件名,问题解决。修改后的代码如下:

import zipfile
import os
def unzip_file(zip_file_path, output_folder_path, encoding='gbk'):
    with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
        zip_ref.extractall(output_folder_path)
    # 遍历解压后的目录,检查并修正文件名
    for root, dirs, files in os.walk(output_folder_path):
        for bad_name in files:
            # 假设这里我们知道ZIP文件使用的是'gbk'编码(但实际情况可能不同)
            if not bad_name.isascii():  # 如果文件名包含非ASCII字符
                true_name = bad_name.encode('cp437').decode(encoding)
                os.rename(os.path.join(root, bad_name), os.path.join(root, true_name))
# 使用示例
zip_file_path = 'example.zip'
output_folder_path = 'output_folder'
unzip_file(zip_file_path, output_folder_path)

不确定你的电脑里是否安装pathlib,因此使用了os,顺利地解决了粉丝的疑问。

粉丝追问:解压文件用什么库比较好?

回答1:这方面我只知道zipfile和代码调用winrar。平时很少接触匹量处理压缩包。

Python代码解压的中文文件名是乱码,怎么解决?

回答2:批量处理压缩包,直接wps批量解压就可以了;

回答3:何须wps,只要电脑上装的有任意解压软件,全选压缩包,右键,可以解压到一个文件夹,也可以每个压缩包单独生成一个文件夹。代码只不过方便遍历多层文件夹目录,如果都在一个文件夹中,还不如右键点选更方便。

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python自动化办公的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【fashjon】提出的问题,感谢【瑜亮老师】给出的思路,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

Python代码解压的中文文件名是乱码,怎么解决?

点赞
收藏
评论区
推荐文章
Python进阶者 Python进阶者
1年前
我在修改jupyter字体的时候输入命令jt -l 遇到了jt既不是内部也不是外部命令咋整?
大家好,我是Python进阶者。一、前言前几天在Python白银交流群【Joker】问了一个Jupyternotebook报错的问题,提问截图如下:!(https://uploadimages.jianshu.io/upload
Python进阶者 Python进阶者
1年前
这个txt文档每章后面都有个这个特殊字符,如何提取出来删除掉?
大家好,我是Python进阶者。一、前言前几天在Python白银交流群【Python狗】问了一个Python正则表达式处理的问题,提问截图如下:!(https://uploadimages.jianshu.io/upload_im
Python进阶者 Python进阶者
1年前
我想在一段文字中扣出关键字附近前后30个字,用正则怎么写?
大家好,我是Python进阶者。一、前言前几天在Python白银交流群【此类生物】问了一个Python数据提取的问题,提问截图如下:!(https://uploadimages.jianshu.io/upload_images/2
Python进阶者 Python进阶者
1年前
盘点一个Python网络爬虫+正则表达式处理案例
大家好,我是Python进阶者。一、前言前几天在Python白银交流群【鑫】问了一个Python网络爬虫的问题,提问截图如下:!(https://uploadimages.jianshu.io/upload_images/2623
Python进阶者 Python进阶者
1年前
pyttsx3语音合成库如何指定是男声?
大家好,我是Python进阶者。一、前言前几天在Python白银交流群【Python小白】问了一个Python库运行的问题,提问截图如下:!(https://uploadimages.jianshu.io/upload_imag
Python进阶者 Python进阶者
1年前
盘点一个Python自动化办公的实战案例(word文件处理)
大家好,我是Python进阶者。一、前言前几天在Python铂金交流群【JethroShen】问了一个Python自动化办公的问题,提问截图如下:!(https://uploadimages.jianshu.io/upload_
Python进阶者 Python进阶者
1年前
我怎么把拆分好的pdf保存在我创建的新文件夹里?
大家好,我是皮皮。一、前言前几天在Python白银交流群【FN】问了一个Python自动化办公的问题,提问截图如下:!(https://uploadimages.jianshu.io/upload_images/26239789
Python进阶者 Python进阶者
4个月前
用python开发一个类似的交互查询系统.用什么库方便?
大家好,我是Python进阶者。一、前言前几天在Python白银交流群【fashjon】问了一个Python库的问题,问题如下:用python开发一个类似的交互查询系统.用什么库方便?二、实现过程这里【啥也不懂】给了一个指导:PYQT这里【kimi】也给了
Python进阶者 Python进阶者
3个月前
matplotlib作图不显示3D图,怎么办?
大家好,我是Python进阶者。一、前言前几天在Python白银交流群【Kim】问了一个Python作图的问题,问题如下:他不显示3D图咋办?代码如下:fromsklearn.datasetsimportloadbreastcancerfromsklear
Python进阶者 Python进阶者
3个月前
盘点一个Python自动化办公的问题
大家好,我是Python进阶者。一、前言前几天在Python铂金交流群【逆光】问了一个Python自动化办公的问题,问题如下:问题我现在有两个表a、b,for循环a、b,如果a的条件满足b,则把b的值赋给a,目前a有7万条数据,b有300条。我写的代码20