关于 MySQL 百万数据量的 count(*) 查询如何优化?
小伙伴们对数据库编程感兴趣吗?是否正在学习相关知识点?如果是,那么本文《关于 MySQL 百万数据量的 count(*) 查询如何优化?》,就很适合你,本篇文章讲解的知识点主要包括MySQL、数据结构、算法、架构。在之后的文章中也会多多分享相关知识点,希望对大家的知识积累有所帮助!
明确需求
对这个问题有兴趣是源于一次开发中遇到要统计人数的需求。类似于“得到”专栏的订阅数。

但是我的数据量比这个大很多,而对数据的准确性要求就不那么高。所以首先要明确需求。其他答案有的说了用缓存,有的答案对比了count(*)、count(1)的区别,都很好,但是我认为还是要看一下题主的场景。我根据我实际开发的经验总结如下几个方面,FYI。

数据量大/准确性要求低/请求量大
- 这种场景一般是C端产品,比如上面说的得到APP的订阅数目,如果对一致性要求不高,可以直接在内存中使用缓存,用guava在内存中做一个缓存定时刷新即可,百万量级count(*)有缓存的频率还不至于有啥性能问题;
- 但是内存内缓存有一个问题就是不同服务器之间的缓存数量是不一致的,可以考虑用redis作为计数,一般这种场景是大多数同学遇到的,简单粗暴搞定即可;
- 用show table status。这个建议还是不要用了,翻了下mysql 的doc,40%的误差概率,碰上就有点大了呀。
TABLE_ROWS
The number of rows. Some storage engines, such as MyISAM, store the exact count. For other storage engines, such as InnoDB, this value is an approximation, and may vary from the actual value by as much as 40% to 50%. In such cases, use SELECT COUNT(*) to obtain an accurate count.
数据量大/准确性要求高/请求量一般
这种场景一般出现在账务上,比如有多少人打款。而且估计DAU在亿级别的公司可能才会遇到。这里最关键的问题还是一致性的要求。在并发系统中,看看我们用redis,我们看看会出现什么样的一致性问题:
时间 A processor B processor T1 插入数据 T2 1.redis#get计数器;2. 查询最新的N条数据 T3 redis#incr
在T2的时间点的时候会出现数据不一致,B看到的是数据已经更新,但是数据库还没更新。我们就在想,如果放到一个事务里面,就可以完美解决这个问题了呀。由于事务,innoDB不支持像MyISAM准确计数,解铃还须系铃人,所以我们建一个计数表(count_table)+事务,解这个问题了。
时间 会话A 会话B T1 begin; 在计数表中插入一条数据; T2 begin; 1. 读count_table; 2. 查询最新的N条数据 commit; T3 更新conut_table; commit;
在T1的时候,如果采用Mysql默认的事务隔离级别:读提交。因为T1事务还没有提交,所以插入的数据,B是读不到的,所以从逻辑上来说是一致的。
数据量大/准确性要求高/请求量特别高
抱歉,没遇到过。如果你觉得你遇到了,你的架构需要你重新design and review,相信我。
带条件count(*)
很多时候我们的业务场景不是数据量多,而是条件复杂。这其实就是一个查询优化的问题了,和是不是count(*)没有关系,那么有以下两招常用,这个得具体问题具体分析了。比如时间维度可以加一个索引来优化;
select * from table_name where a = x and b = x;
- 加索引
- 业务拆分
count性能比较
- count(primary key)。遍历整个表,把主键值拿出来,累加;
- count(1)。遍历整个表,但是不取值,累加;
- count(非空字段)。遍历整个表,读出这个字段,累加;
- count(可以为空的字段)。遍历整个表,读出这个字段,判断不为null累加;
- count(*)。遍历整个表,做了优化,不取值,累加。
结合mysql的一些索引查询知识,我们可以大致得出如下结论。

建议直接使用count(*)。

今天关于《关于 MySQL 百万数据量的 count(*) 查询如何优化?》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

- 上一篇
- OA软件之工作日志,助你及时修正工作偏差

- 下一篇
- 【巨杉数据库Sequoiadb】sdb backupOffline 相关问题
-
- 笑点低的花瓣
- 赞 👍👍,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢作者大大分享技术文章!
- 2023-03-31 07:43:54
-
- 活力的手机
- 这篇技术文章真及时,太全面了,真优秀,已收藏,关注楼主了!希望楼主能多写数据库相关的文章。
- 2023-03-25 14:01:18
-
- 复杂的店员
- 写的不错,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢作者大大分享文章内容!
- 2023-02-21 23:51:00
-
- 专注的大碗
- 这篇技术贴真及时,太全面了,很棒,码住,关注作者了!希望作者能多写数据库相关的文章。
- 2023-02-20 05:38:08
-
- 数据库 · MySQL | 18小时前 | 索引 数据类型 字符集 存储引擎 CREATETABLE
- MySQL新建表操作指南与建表技巧
- 462浏览 收藏
-
- 数据库 · MySQL | 1个月前 | 条件判断
- CASEWHEN条件判断的嵌套使用详解与实战场景分析
- 469浏览 收藏
-
- 数据库 · MySQL | 1个月前 | java php
- CSV文件批量导入MySQL的性能优化秘籍大揭秘
- 289浏览 收藏
-
- 数据库 · MySQL | 1个月前 |
- GaleraCluster多主集群配置与冲突解决攻略
- 239浏览 收藏
-
- 数据库 · MySQL | 1个月前 | 窗口函数实战
- MySQL窗口函数实战案例深度剖析
- 315浏览 收藏
-
- 数据库 · MySQL | 1个月前 | 自定义函数
- MySQL插件开发入门:自定义函数(UDF)编写指南
- 184浏览 收藏
-
- 数据库 · MySQL | 1个月前 |
- Windows系统MySQL8.0免安装版配置攻略
- 227浏览 收藏
-
- 数据库 · MySQL | 1个月前 | MySQL错误 数据库诊断
- 深度解析错误代码1045/1217/1205的根本原因及解决方案
- 202浏览 收藏
-
- 数据库 · MySQL | 1个月前 | sql注入 编码规范
- 防范SQL注入必备:编码规范与工具推荐指南
- 140浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 笔灵AI生成答辩PPT
- 探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
- 16次使用
-
- 知网AIGC检测服务系统
- 知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
- 24次使用
-
- AIGC检测-Aibiye
- AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
- 30次使用
-
- 易笔AI论文
- 易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
- 42次使用
-
- 笔启AI论文写作平台
- 笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
- 35次使用
-
- golang MySQL实现对数据库表存储获取操作示例
- 2022-12-22 499浏览
-
- Golang迭代如何在Go中循环数据结构使用详解
- 2022-12-22 148浏览
-
- 详解如何在Go语言中循环数据结构
- 2022-12-22 406浏览
-
- goHTTP2的头部压缩算法hpack实现详解
- 2022-12-22 398浏览
-
- 分享Redis高可用架构设计实践
- 2023-01-24 286浏览