Pythonzip文件压缩教程:zipfile模块使用详解
一分耕耘,一分收获!既然打开了这篇文章《Python压缩文件教程:zipfile模块详解》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!
Python处理文件压缩主要使用内置的zipfile模块,1. 压缩单个文件可通过ZipFile对象写入模式实现;2. 压缩多个文件或目录则遍历路径逐一添加;3. 解压操作支持全部或指定文件提取;4. 查看压缩包内容可使用infolist方法;5. 处理大文件时需注意内存占用和性能优化。该模块功能全面,从基础压缩、解压到高级控制均能胜任,但大规模数据操作时应避免一次性加载过多数据进内存,并推荐使用with语句确保资源释放。
Python处理文件压缩这事儿,其实内置的zipfile
模块就能搞定,非常直接高效。

要用Python来压缩文件,核心就是zipfile
模块。它功能挺全面的,从单个文件到整个目录,都能给你安排得明明白白。

最基础的,比如你要把一个文件塞进压缩包:
import zipfile import os def compress_single_file(file_path, output_zip_path): # 确保文件存在,不然会报错 if not os.path.exists(file_path): print(f"错误:文件 '{file_path}' 不存在。") return # 使用with语句,确保文件操作结束后资源被正确释放,这很重要 try: with zipfile.ZipFile(output_zip_path, 'w', zipfile.ZIP_DEFLATED) as zf: # arcname参数很重要,决定了文件在压缩包里的名字, # 如果不指定,默认是完整路径,可能不是你想要的 zf.write(file_path, arcname=os.path.basename(file_path)) print(f"'{file_path}' 已成功压缩到 '{output_zip_path}'。") except Exception as e: print(f"压缩过程中出现错误:{e}") # 示例用法: # # 先创建一个测试文件 # with open('my_document.txt', 'w', encoding='utf-8') as f: # f.write("这是一些测试内容,用于演示文件压缩。\n第二行内容。") # compress_single_file('my_document.txt', 'my_archive.zip')
要是想把好几个文件一起打包,或者干脆把一个文件夹里的所有东西都收进去,那也行:

import zipfile import os def compress_multiple_files(file_paths, output_zip_path): try: with zipfile.ZipFile(output_zip_path, 'w', zipfile.ZIP_DEFLATED) as zf: for file_path in file_paths: if os.path.exists(file_path): zf.write(file_path, arcname=os.path.basename(file_path)) else: print(f"警告:文件 '{file_path}' 不存在,已跳过。") print(f"指定文件已成功压缩到 '{output_zip_path}'。") except Exception as e: print(f"压缩多个文件时出现错误:{e}") def compress_directory(dir_path, output_zip_path): if not os.path.isdir(dir_path): print(f"错误:目录 '{dir_path}' 不存在或不是一个目录。") return try: with zipfile.ZipFile(output_zip_path, 'w', zipfile.ZIP_DEFLATED) as zf: # os.walk 是遍历目录的神器,它会递归地找出所有文件和子目录 for root, _, files in os.walk(dir_path): for file in files: full_path = os.path.join(root, file) # 计算文件在zip中的相对路径,这很关键,否则会把整个绝对路径都带进去 # 比如,如果dir_path是'my_folder',full_path是'my_folder/sub/file.txt' # 那么arcname就会是'sub/file.txt' arcname = os.path.relpath(full_path, dir_path) zf.write(full_path, arcname=arcname) print(f"目录 '{dir_path}' 已成功压缩到 '{output_zip_path}'。") except Exception as e: print(f"压缩目录时出现错误:{e}") # 示例用法: # # 创建一些测试文件和目录 # os.makedirs('test_dir/subdir', exist_ok=True) # with open('test_dir/file1.txt', 'w', encoding='utf-8') as f: f.write("内容1") # with open('test_dir/subdir/file2.txt', 'w', encoding='utf-8') as f: f.write("内容2") # # compress_multiple_files(['test_dir/file1.txt'], 'my_multi_archive.zip') # compress_directory('test_dir', 'my_dir_archive.zip')
这里有个小细节,zipfile.ZIP_DEFLATED
是指定压缩方式,通常用这个就够了,效果比较好。'w'
是写入模式,如果文件存在就覆盖。
除了压缩,zipfile模块还能做什么?
zipfile
模块可不只是个压缩工具,它还是个解压缩的好手,甚至能让你窥探压缩包里的内容,检查完整性。这在处理别人给的压缩文件时特别有用,你总不能直接解压到一半发现文件损坏了吧?
比如,你想看看一个zip文件里都有啥:
import zipfile import os def list_zip_contents(zip_path): if not os.path.exists(zip_path): print(f"错误:文件 '{zip_path}' 不存在。") return if not zipfile.is_zipfile(zip_path): print(f"错误:'{zip_path}' 不是一个有效的zip文件。") return print(f"'{zip_path}' 中的内容:") try: with zipfile.ZipFile(zip_path, 'r') as zf: for info in zf.infolist(): # info.filename 是文件名 # info.file_size 是原始大小 # info.compress_size 是压缩后大小 print(f" 文件名: {info.filename}, 原始大小: {info.file_size} bytes, 压缩后大小: {info.compress_size} bytes") except Exception as e: print(f"读取zip文件内容时出现错误:{e}") # 示例用法: # list_zip_contents('my_archive.zip') # 假设这个文件存在
解压文件就更直接了,extractall
一句话搞定所有,或者extract
只解压特定的:
import zipfile import os def extract_zip_file(zip_path, extract_to_dir): if not os.path.exists(zip_path): print(f"错误:文件 '{zip_path}' 不存在。") return if not zipfile.is_zipfile(zip_path): print(f"错误:'{zip_path}' 不是一个有效的zip文件。") return os.makedirs(extract_to_dir, exist_ok=True) # 确保目标目录存在 try: with zipfile.ZipFile(zip_path, 'r') as zf: # 解压所有文件到指定目录 zf.extractall(extract_to_dir) print(f"'{zip_path}' 已成功解压到 '{extract_to_dir}'。") except Exception as e: print(f"解压过程中出现错误:{e}") # 示例用法: # # 假设 'my_dir_archive.zip' 存在 # extract_zip_file('my_dir_archive.zip', 'extracted_content')
有时候,你可能只想解压其中某个文件,比如zf.extract('path/to/file_in_zip.txt', path='destination_folder')
,这样就灵活多了。
处理大型文件时,zipfile模块有哪些注意事项?
当你用zipfile
处理特别大的文件或者整个目录,比如几个GB的数据集时,有些事儿就得留心了。性能和内存占用是两个大头。
首先是内存。zipfile
在处理文件时,尤其是解压时,如果不对内存做限制,可能会一次性读取大量数据到内存,这对于内存有限的系统来说是个灾难。所以,尽量避免一次性处理所有文件,特别是当你用read()
或者read(size)
从ZipFile
对象中读取文件内容时,最好分块读取,或者直接使用extract
方法让它自己处理。
其次是效率。直接用zipfile.ZipFile(output_zip_path, 'w', zipfile.ZIP_DEFLATED)
这种模式,它会先在内存里构建一些结构,然后才写入磁盘。对于超大型的归档操作,你可能需要考虑流式处理,或者更底层的文件操作来避免内存峰值。不过,对于大多数日常使用场景,zipfile
已经优化得相当不错了。
还有一个小点,就是append
模式。zipfile.ZipFile(path, 'a')
可以往已有的zip文件里追加内容。但要注意,这个追加操作其实效率并不高,因为它可能需要重新构建zip文件的目录结构,甚至重写部分内容。所以,如果需要频繁追加,可能得考虑其他方案,或者先全部收集好再一起压缩。
最后,记得用with
语句。这不只是个好习惯,更是避免资源泄漏的关键。尤其是在处理大文件时,确保文件句柄
今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

- 上一篇
- 文件不存在?用suppress简洁处理异常

- 下一篇
- Win10长屏截图快捷键大全
-
- 文章 · python教程 | 3分钟前 |
- Python在NLP中的应用与主流库解析
- 425浏览 收藏
-
- 文章 · python教程 | 4分钟前 |
- PyCharm字体设置技巧分享
- 151浏览 收藏
-
- 文章 · python教程 | 5分钟前 |
- Python连接MySQL的几种方法
- 117浏览 收藏
-
- 文章 · python教程 | 35分钟前 |
- Python多进程共享数据怎么实现?
- 473浏览 收藏
-
- 文章 · python教程 | 53分钟前 | 特征工程 Featuretools EntitySet DFS算法 自动化特征生成
- Python特征工程:Featuretools快速建模技巧
- 364浏览 收藏
-
- 文章 · python教程 | 56分钟前 |
- Flask-Login使用教程与入门指南
- 354浏览 收藏
-
- 文章 · python教程 | 58分钟前 |
- Python异常处理测试技巧分享
- 409浏览 收藏
-
- 文章 · python教程 | 1小时前 |
- PythonRedis事务操作全解析
- 223浏览 收藏
-
- 文章 · python教程 | 1小时前 |
- Python语音合成教程:pyttsx3使用全解析
- 349浏览 收藏
-
- 文章 · python教程 | 1小时前 |
- 正则条件匹配怎么用?if-else写法详解
- 121浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 509次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 边界AI平台
- 探索AI边界平台,领先的智能AI对话、写作与画图生成工具。高效便捷,满足多样化需求。立即体验!
- 28次使用
-
- 免费AI认证证书
- 科大讯飞AI大学堂推出免费大模型工程师认证,助力您掌握AI技能,提升职场竞争力。体系化学习,实战项目,权威认证,助您成为企业级大模型应用人才。
- 52次使用
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 176次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 252次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 194次使用
-
- Flask框架安装技巧:让你的开发更高效
- 2024-01-03 501浏览
-
- Django框架中的并发处理技巧
- 2024-01-22 501浏览
-
- 提升Python包下载速度的方法——正确配置pip的国内源
- 2024-01-17 501浏览
-
- Python与C++:哪个编程语言更适合初学者?
- 2024-03-25 501浏览
-
- 品牌建设技巧
- 2024-04-06 501浏览