Redis 内存告警运行手册:从 INFO memory 到淘汰策略和临时止血
Redis 内存告警不要第一时间只盯着“扩容”。更稳的处理方式是先确认告警是否真实、判断增长来源,再决定临时止血还是调整策略。否则很容易在高峰期误删热点数据,或者把一个大 key 问题误判成容量不足。
这篇文章按运维运行手册写:从触发信号开始,给出快速判断命令、处理步骤、回滚路径、告警确认和复盘项,适合值班时直接照着走。
- 触发信号:什么时候进入 Redis 内存告警流程
- 快速判断:先看 INFO memory 和策略配置
- 处理步骤:找增长来源并做临时止血
- 回滚路径:避免误删和策略误改
- 告警确认:看内存、淘汰和业务错误是否恢复
- 复盘项:把一次告警变成容量规则
触发信号:什么时候进入 Redis 内存告警流程
建议把 Redis 内存告警拆成三类信号,避免所有情况都按“内存满了”处理:
- 容量信号:
used_memory接近实例上限,或者云监控显示内存使用率超过阈值。 - 淘汰信号:
evicted_keys持续增长,说明 Redis 已经开始主动淘汰 key。 - 业务信号:接口延迟升高、缓存命中率下降、写入失败或热 key 访问异常。
处理流程可以先固定成一张值班图:先确认告警,再判断增长来源,之后才做策略调整或业务降载。

快速判断:先看 INFO memory 和策略配置
值班时先拿三组信息,不要直接改配置:
redis-cli -h 127.0.0.1 -p 6379 INFO memory redis-cli -h 127.0.0.1 -p 6379 INFO stats redis-cli -h 127.0.0.1 -p 6379 CONFIG GET maxmemory redis-cli -h 127.0.0.1 -p 6379 CONFIG GET maxmemory-policy
重点看这些字段:
used_memory_human:当前 Redis 已使用内存。used_memory_peak_human:历史峰值,判断是否是短时突增。mem_fragmentation_ratio:碎片率过高时,内存看起来会比数据体积更紧张。evicted_keys:如果持续增长,说明已经触发淘汰。maxmemory和maxmemory-policy:确认是否有上限以及用什么淘汰策略。
一个常见判断是:如果 used_memory 持续增长而 evicted_keys 也增长,说明容量压力已经影响数据保留;如果 used_memory 接近上限但 evicted_keys 不动,要检查策略是否是 noeviction。
处理步骤:找增长来源并做临时止血
确认告警真实后,按风险从低到高处理。
1. 先看 key 数量和过期情况
redis-cli DBSIZE redis-cli INFO keyspace
如果 key 数量快速上涨,优先怀疑缓存 key 没有设置过期时间、批量任务写入异常,或某个业务前缀爆发。
2. 再查大 key,但要控制扫描影响
redis-cli --bigkeys -i 0.05
--bigkeys 会扫描 key 空间,生产环境建议在低峰期或只读副本上运行,并加 -i 降低连续扫描压力。如果已经知道业务前缀,可以用 SCAN 缩小范围:
redis-cli --scan --pattern 'session:*' | head -100
3. 临时止血先选低风险动作
- 暂停非核心批量写缓存任务。
- 缩短异常前缀的 TTL,先控制新增内存。
- 对确认无用的临时 key 分批删除,避免一次性阻塞。
- 如果业务允许,临时调低缓存写入比例。
不要在没有确认前缀和用途时直接批量删除。Redis 内存告警的目标是恢复稳定,不是制造第二次故障。
回滚路径:避免误删和策略误改
任何止血动作都要留回滚路径,特别是调整 maxmemory-policy 或删除 key 前缀时。

- 配置变更前:记录当前
maxmemory、maxmemory-policy和实例规格。 - 删除前缀前:确认 key 业务含义、是否可重建、是否会影响登录或订单等核心链路。
- 任务降载前:保留恢复入口,确认负责人和恢复条件。
- 策略调整后:保留原配置,恢复失败时能立即改回。
如果改过淘汰策略,例如从 noeviction 改为某个 LRU/LFU 策略,必须在事故窗口结束后评审是否长期保留。临时策略不应自动变成永久策略。
告警确认:看内存、淘汰和业务错误是否恢复
处理后至少观察三组指标:
redis-cli INFO memory redis-cli INFO stats redis-cli INFO commandstats
used_memory是否停止上涨或回落到安全水位。evicted_keys是否停止快速增长。- 业务接口错误率、延迟和缓存命中率是否恢复。
- 批量任务恢复后,内存是否再次上涨。
如果内存回落但业务错误仍在,就不能只关闭 Redis 告警;需要继续查调用方超时、连接池等待或缓存 miss 造成的数据库压力。
复盘项:把一次告警变成容量规则
事故结束后,把这次处理沉淀成下一次更快的判断规则:
- 本次内存增长来自哪个业务前缀,是否缺少 TTL。
- 是否存在大 key,最大 key 属于哪类数据结构。
- 当前
maxmemory是否合理,淘汰策略是否匹配业务。 - 是否需要给批量任务加写入速率限制。
- 监控是否能提前发现
used_memory增长斜率。 - 是否需要拆分实例,避免临时缓存和核心会话混在一起。
Redis 内存告警的关键是把“容量压力”拆成可判断的信号:到底是 key 数量增长、大 key 膨胀、TTL 缺失、策略不当,还是业务突增。只要判断链路固定下来,值班处理就会从临场猜测变成可复用的运行手册。
AI 聊天流式输出前端配方:用 Fetch Stream 实现逐字渲染和中断控制
- 上一篇
- AI 聊天流式输出前端配方:用 Fetch Stream 实现逐字渲染和中断控制
- 下一篇
- CSS sticky 不生效排查清单:从 top、overflow 到滚动容器逐层定位
-
- 数据库 · Redis | 6小时前 | Redis · 缓存治理 · Keyspace Notifications · 过期事件 · redis Pub/Sub Keyspace Notifications 过期事件 缓存监听 补偿任务
- Redis 过期事件监听实践:用 Keyspace Notifications 做轻量补偿
- 181浏览 收藏
-
- 数据库 · Redis | 2星期前 | Redis · Streams · 消费者组 · Pending · XACK · 消息堆积 消费者组 XACK XPENDING XAUTOCLAIM Redis Streams
- Redis Streams 消费者组消息堆积怎么办:从 XPENDING 到 XACK 一步步排查
- 385浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ljg-skills
- ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
- 2792次使用
-
- MELO音乐
- MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
- 2583次使用
-
- UniScribe
- UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
- 2529次使用
-
- 剧云
- 剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
- 2760次使用
-
- 万象有声
- 万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
- 2713次使用
-
- 在windows上用docker desktop安装StoneDB
- 2023-01-20 100浏览
-
- MySQL如何给大表加索引
- 2023-01-26 100浏览
-
- Mysql日志
- 2023-02-17 100浏览
-
- MySQL安装使用学习教程,学mysql数据库入门的不二之选
- 2023-02-24 100浏览
-
- 因为我的一个低级错误,生产数据库崩溃了将近半个小时
- 2023-02-24 100浏览

