Python 原子写配置文件实战:tempfile 和 os.replace 防止半截文件
很多小工具都会把配置写到本地文件,例如 settings.json、config.ini 或任务状态文件。直接打开目标文件写入看起来最简单,但线上最怕写到一半时程序被终止、磁盘空间不足,或者机器突然重启,最后留下一个半截文件。
更稳的做法是原子写入:先把新内容写到同目录的临时文件,确认写完并刷盘后,再用 os.replace() 一步替换目标文件。这样读配置的进程要么看到旧文件,要么看到新文件,不会读到半截内容。
适合人群
适合需要写本地配置、缓存索引、任务进度文件的 Python 开发者。你需要了解基础文件读写和 JSON 序列化。
目录
- 直接覆盖为什么容易留下半截文件
- 原子写入的正确流程
- 封装一个可复用的 JSON 配置保存函数
- 常见坑位和上线建议
直接覆盖为什么容易留下半截文件
直接写目标文件的风险在于:打开文件后原内容可能已经被截断,但新内容还没完整写进去。如果这时程序退出,文件就会停在一个不可解析的中间状态。对 JSON 配置来说,这种状态通常表现为少了右括号、字段只写了一半,后续服务启动时就会解析失败。

原子写入的正确流程
原子写入的关键点有三个:临时文件必须放在目标文件同一个目录,写完后要先刷新到磁盘,最后再用 os.replace() 替换。放在同目录是为了减少跨分区移动带来的不确定性;使用替换操作,是为了让文件切换尽量变成一个不可再拆的小动作。

封装一个可复用的 JSON 配置保存函数
下面的函数只使用 Python 标准库。它会把字典写成格式化 JSON,再用临时文件完成原子替换。
import json
import os
import tempfile
from pathlib import Path
from typing import Any
def save_json_atomic(path: str, data: dict[str, Any]) -> None:
target = Path(path)
target.parent.mkdir(parents=True, exist_ok=True)
text = json.dumps(data, ensure_ascii=False, indent=2) + "\n"
fd, temp_name = tempfile.mkstemp(
prefix=f".{target.name}.",
suffix=".tmp",
dir=str(target.parent),
text=True,
)
try:
with os.fdopen(fd, "w", encoding="utf-8") as handle:
handle.write(text)
handle.flush()
os.fsync(handle.fileno())
os.replace(temp_name, target)
except BaseException:
try:
os.unlink(temp_name)
except FileNotFoundError:
pass
raise
调用方式很简单:
config = {
"debug": False,
"workers": 4,
"api_base": "https://api.example.local",
}
save_json_atomic("runtime/settings.json", config)
如果写入过程失败,目标文件仍然保留旧内容;如果替换完成,读配置的代码会看到完整的新内容。
常见坑位和上线建议
1. 临时文件不要放到系统临时目录
很多人会把临时文件放在默认临时目录,但这可能和目标文件不在同一个分区。稳妥做法是把临时文件放在目标文件同目录,减少替换时的意外情况。
2. 写完后不要忘记刷新
flush() 会把 Python 缓冲区推给操作系统,os.fsync() 会进一步要求落到磁盘。对重要配置来说,这一步能降低机器异常退出时丢内容的概率。
3. 异常时清理临时文件
写入失败后,隐藏临时文件可能留在目录里。上面的代码在异常分支里做了清理,避免目录里堆满无用文件。
4. 多进程同时写要加锁
原子替换解决的是“读到半截文件”的问题,不解决“多个进程抢着写”的问题。如果多个进程可能同时保存同一个配置,还需要额外加文件锁或集中到单个写入服务。
小结
Python 写配置文件时,直接覆盖目标文件虽然省事,但遇到中断容易留下半截内容。使用 tempfile.mkstemp() 写同目录临时文件,再通过 flush()、os.fsync() 和 os.replace() 完成替换,可以让本地配置保存更稳,特别适合命令行工具、桌面小工具和轻量任务系统。
Python heapq 统计日志 TopK 实战:大文件里找出高频接口
- 上一篇
- Python heapq 统计日志 TopK 实战:大文件里找出高频接口
- 下一篇
- Redis Bitmap 用户签到实战:SETBIT、GETBIT 和 BITCOUNT 怎么用
-
- 文章 · python教程 | 1天前 | 日志 · 链路追踪 · Python教程 · contextvars · Python logging contextvars 日志追踪 trace_id 异步上下文
- Python 日志链路追踪实战:用 contextvars 自动带上 trace_id
- 370浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 8177次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 8606次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 8430次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 10345次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 9227次使用
-
- GScript 编写标准库示例详解
- 2022-12-30 369浏览
-
- HTTP 的 response 中的响应体和头部是分开发送的吗?
- 2023-01-28 387浏览
-
- 关于Golang标准库flag的全面讲解
- 2023-02-25 344浏览
-
- Go中的应用配置管理详解
- 2023-02-16 218浏览
-
- B站等视频网站的弹幕用的是 websocket 还是轮询?
- 2023-02-16 447浏览

