当前位置:首页 > 文章列表 > 数据库 > MySQL > 【数据库】MySQL查询优化

【数据库】MySQL查询优化

来源:SegmentFault 2023-02-24 11:12:59 0浏览 收藏

本篇文章向大家介绍《【数据库】MySQL查询优化》,主要包括MySQL、Mysql索引、MySQL优化,具有一定的参考价值,需要的朋友可以参考一下。

欢迎关注公众号:【爱编码
如果有需要后台回复2019赠送1T的学习资料哦!!

背景

在这个快速发展的时代,时间变得
越来越重要,也流逝得非常得快,有些人长大了,有些人却变老了。稍不留神,2019已经过完了三分之一。回首这四个月收获什么,懂得了什么?欢迎留言分享给我哟。

**言归正传:
MySQL的查询怎么才能更快,更合理?除了加索引还有什么可以学习的呢?**

原理

要想更好地学习某样东西,从其原理和运作方式入手更容易掌握。道理你们都懂,我就不废话了。

MySQL发送查询请求,到底做了什么工作?

下图是MySQL查询执行流程图

查询执行路径
  1. 客户端发送一条查询给服务器。
  2. 服务器先检查查询缓存,如果命中了缓存,则立刻返回查询在缓存中的结果。否则会进入下一个阶段。

3.服务端进行SQL解析、预处理、再由优化器生成对应的执行计划。
4.MySQL根据优化器生成的执行计划,调用存储引擎的API来执行查询。
5.将结果返回给客户端。

是什么导致MySQL查询变慢了?

对于MySQL,最简单的衡量查询开销的三个指标如下:

  • 响应时间
  • 扫描的行数
  • 返回的行数

没有哪个指标能够完美地衡量查询的开销,但它们大致反映了MySQL在内部执行查询时需要访问多少数据,并可以大概推算出查询运行的时间。

查询慢的原因基本都是:我们的不合理操作导致查询的多余数据太多了
常见原因有以下:

1.查询不需要的记录。
2.多表关联时返回全部列
3.总是取出全部列

常用优化技巧

1.用索引

最简单且见效最快的方式就是给你的条件加索引(主键索引,普通索引,唯一索引等)。注:索引是要另开辟一块空间存储的,所以不能不要钱滴都加索引。

2.关联子查询

MySQL的子查询实现是非常糟糕的。比如下面的

SELECT * FROM book WHERE book_id IN (SELECT book_id FROM author WHERE author_id = 1)

MySQL对IN()列表中的选项有专门的优化策略,一般会认为MySQL会先执行子查询返回所有包含author_id 为1的book_id。

或许你想MySQL的运行时这样子的:

SELECT GROUP_CONCAT(book_id) FROM author WHERE author_id = 1
SELECT * FROM book WHERE book_id IN (1,21,3,45,656,766,213,123)

但是,MySQL会将相关的外层表压到子查询中的,就是下面的样子:

SELECT * FROM book WHERE EXISTS 
(SELECT * FROM author WHERE author_id = 1 AND book.book_id = author.book_id)

原因:因为子查询需要book_id ,所以MySQL认为无法先执行这个子查询,而是先对book 进行全表扫描,然后再根据book_id进行子查询。具体可以EXPLAIN该SQL进行分析。

建议:
1.使用左外连接(LEFT OUTER JOIN)代替子查询

SELECT * from book LEFT OUTER JOIN author USING(book_id) WHERE author.author_id = 1

影响因素:还有数据表放的位置等,具体应用场景就只能你自己explain该语句对比哪种性能比较好点。

2.确保ON或者USING子句的列上有索引
在创建索引的时候就要考虑到关联的顺序。

3.UNION使用

如果希望UNION的各个子句能根据LIMIT只取部分结果集,或者希望能够先排好序再合并结果集的话。
第一个例子:会将author 表和user 表两个表都存放到一个临时表中,再从临时表中取出前20条。

(SELECT first_name FROM author ORDER BY last_name)
UNION ALL
(SELECT first_name FROM user ORDER BY last_name)
LIMIT 20

对比上面的这样子,就有很大的改善了。

(SELECT first_name FROM author ORDER BY last_name LIMIT 20)
UNION ALL
(SELECT first_name FROM user ORDER BY last_name LIMIT 20)
LIMIT 20

4.最大值和最小值

比如:
求最小值
第一种方案:

SELECT MIN(id) FROM article WHERE author = 'zero'

第二种方案:

SELECT id FROM article USE INDEX(PRIMARY) WHERE author = 'zero' LIMIT 1

和第一种方案的对比,效果其实是一样的,但是它们的性能略有不同,具体还请自己具体场景分析,择优选择。

5.COUNT()查询

比如如果想统计文章id大于25的数量,可以如下:

EXPLAIN SELECT COUNT(*) FROM article WHERE id >25

另外一种思路:可以先查询文章总数,减去小于等于25的数量。仅仅提供思路,具体效果还是你具体情况,自己比较,择优选择。

EXPLAIN SELECT (SELECT COUNT(*) FROM article) - COUNT(*) FROM article WHERE id 

题外话:
如果需要区分不同颜色的商品数量时,可以如下做法:

seelct count(color = 'blue' OR NULL) as blue,COUNT(color = 'red' OR NULL)  AS RED FROM items

6.GROUP BY和DISTINCT

它们的优化最有效的方法就是用索引来。
但是GROUP BY有时候用得不对,索引是会失效的。
比如:把两个单独的索引合并成一个组合索引,即把where条件字段的索引和group by的分组字段索引组合成一个。

解决方法:参考这篇函数索引

7.limit分页

下面这条查询,非常常见。

select film_id,description from film order by title limit 50,5;

但是如果这个表很大的时候,那么这个50变成100654这样子的话,这里MySQL就要扫描100654+5条数据,然后丢弃100654条,仅仅去最后5条。
一种思路:

select film_id,description from film inner join (select film_id from film order by title limit 50,5) as lim USING(film_id);

该思路是通过延迟关联将大大提升查询效率,它让MySQL扫描尽可能少的页面。获取需要访问的记录后,再更加关联列会原表查询所需要的所有列。以上并不一定符合你,具体还需explain对比择优使用。

小结:
总体来说都是围绕着尽量少全表扫描,尽量使用索引进行优化。
最后往往是要自己在实际场景多用explain分析是否有更好的sql解决方案。

索引会失效的场景

1.隐式转换导致索引失效.
这一点应当引起重视.也是开发中经常会犯的错误. 由于表的字段tu_mdn定义为varchar2(20),但在查询时把该字段作为number类型以where条件传给Oracle,这样会导致索引失效.

 错误的例子:select * from test where tu_mdn=13333333333;
 正确的例子:select * from test where tu_mdn='13333333333';

2. 对索引列进行运算导致索引失效
所指的对索引列进行运算*包括(+,-,,/,! 等)

 错误的例子:select * from test where id-1=9;
 正确的例子:select * from test where id=10;

3. 使用内部函数导致索引失效.
对于这样情况应当创建基于函数的索引.

// 错误的例子:
select * from test where round(id)=10; //说明,此时id的索引已经不起作用了
 //正确的例子:首先建立函数索引
create index test_id_fbi_idx on test(round(id));
//然后 
select * from test where round(id)=10; 

4. 不要将空的变量值直接与比较运算符(符号)比较。
如果变量可能为空,应使用 IS NULL 或 IS NOT NULL 进行比较,或者使用 ISNULL 函数。

5. 不要在 SQL 代码中使用双引号。
因为字符常量使用单引号。如果没有必要限定对象名称,可以使用(非 ANSI SQL 标准)括号将名称括起来。

6. 以下使用会使索引失效,应避免使用

a. 使用 、not in 、not exist、!=
b. like "%_" 百分号在前(可采用在建立索引时用reverse(columnName)这种方法处理)
c. 单独引用复合索引里非第一位置的索引列.应总是使用索引的第一个列,如果索引是建立在多个列上, 只有在它的第一个列被where子句引用时,优化器才会选择使用该索引。
d. 字符型字段为数字时在where条件里不添加引号.
e. 当变量采用的是times变量,而表的字段采用的是date变量时.或相反情况。

暂时统计到这么多,如果有更多的以后再补充。

MySQL的EXPLAIN的使用

EXPLAIN是用来分析SQL执行情况分析的

EXPLAIN 命令的输出内容大致如下:

mysql> explain select * from user_info where id = 2\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: user_info
   partitions: NULL
         type: const
possible_keys: PRIMARY
          key: PRIMARY
      key_len: 8
          ref: const
         rows: 1
     filtered: 100.00
        Extra: NULL
1 row in set, 1 warning (0.00 sec)

各列的含义如下:

  • id: SELECT 查询的标识符. 每个 SELECT 都会自动分配一个唯一的标识符.
  • select_type: SELECT 查询的类型.
  • table: 查询的是哪个表
  • partitions: 匹配的分区
  • type: join 类型
  • possible_keys: 此次查询中可能选用的索引
  • key: 此次查询中确切使用到的索引.
  • ref: 哪个字段或常数与 key 一起被使用
  • rows: 显示此查询一共扫描了多少行. 这个是一个估计值.
  • filtered: 表示此查询条件所过滤的数据的百分比
  • extra: 额外的信息

更详细的可以参考这篇【性能优化神器 Explain 使用分析】或者【高性能MySQL

总结

查询优化目的就是为了快速得到结果,所以每当写完SQL应该思考以下几点:

  • 是否需要全表查询以及返回的数据是否合理。
  • 是否需要索引,索引是否合理。
  • 是否有更好的解决办法。

最后

如果对 Java、大数据感兴趣请长按二维码关注一波,我会努力带给你们价值。觉得对你哪怕有一丁点帮助的请帮忙点个赞或者转发哦。
关注公众号【爱编码】,回复2019有相关资料哦。

今天关于《【数据库】MySQL查询优化》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于mysql的内容请关注golang学习网公众号!

版本声明
本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
MySQL - 扩展性 2 扩展策略:氪金氪脑任君选MySQL - 扩展性 2 扩展策略:氪金氪脑任君选
上一篇
MySQL - 扩展性 2 扩展策略:氪金氪脑任君选
究竟什么是技术?非科班程序员两年的内心挣扎!
下一篇
究竟什么是技术?非科班程序员两年的内心挣扎!
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • PPTFake答辩PPT生成器:一键生成高效专业的答辩PPT
    PPTFake答辩PPT生成器
    PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
    10次使用
  • SEO标题Lovart AI:全球首个设计领域AI智能体,实现全链路设计自动化
    Lovart
    SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
    9次使用
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    26次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    25次使用
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    52次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码