当前位置:首页 > 文章列表 > 数据库 > MySQL > 【MySQL—SQL编程】子查询

【MySQL—SQL编程】子查询

来源:SegmentFault 2023-01-20 18:44:01 0浏览 收藏

在IT行业这个发展更新速度很快的行业,只有不停止的学习,才不会被行业所淘汰。如果你是数据库学习者,那么本文《【MySQL—SQL编程】子查询》就很适合你!本篇内容主要包括【MySQL—SQL编程】子查询,希望对大家的知识积累有所帮助,助力实战开发!

子查询是指在一个SELECT语句中嵌套另一个SELECT语句。

通常来讲,使用子查询的好处如下:

  • 子查询允许结构化的查询,这样就可以把一个查询语句的每个部分隔开。
  • 子查询提供了另一种方法来执行有些需要复杂的JOIN和UNION来实现的操作。
  • 在许多人看来,子查询可读性较高。

一个子查询会返回一个标量(单一值)、一个行、一个列或一个表(一行或多行及一列或多列),这些子查询被称为标量、列、行和表子查询。可返回一个特定种类结果的子查询经常只用于特定的语境中。子查询可以包括普通SELECT可以包括的任何关键词或子句,如DISTINCT、GROUP BY、ORDERBY、LIMIT、JOIN、UNION等。

子查询的限制是其外部语句必须是以下语句之一:SELECT、INSERT、UPDATE、DELETE、SET或DO。还有一个限制是,目前用户不能既在一个子查询中修改一个表,又在同一个表中进行选择,虽然这样的操作可用于普通的DELETE、INSERT、REPLACE和UPDATE语句中,但是对子查询不可以同时进行这样的操作。

常用关键词(ANY/IN/SOME/ALL)

使用ANY、IN、SOME和ALL进行子查询的语法如下:

operand comparison_operator ANY (subquery)
operand IN (subquery)
operand comparison_operator SOME (subquery)
operand comparison_operator ALL (subquery)

ANY关键词必须与一个比较操作符一起使用。ANY关键词的意思是“对于子查询返回的列中的任一数值,如果比较结果为TRUE,则返回TRUE”。例如:

SELECT s1 FROM t1 WHERE s1 > ANY (SELECT s1 FROM t2);

关键词IN是“= ANY”的别名,关键词SOME是ANY的别名。

ALL关键词也必须与比较操作符一起使用。ALL的意思是“对于子查询返回的列中的所有值,如果比较结果为TRUE,则返回TRUE”。

独立子查询

独立子查询是不依赖外部查询而运行的子查询。

举个例子,现在有一张订单表,我们需要查询出每月最后实际订单日期发生的订单。在这里,每月最后实际订单的日期可能并不是每月的最后一天。因此,每月最后订单日期需要通过子查询来判断。查询语句如下:

SELECT orderid,customerid,employeeid,orderdate
    FROM orders
    WHERE orderdate IN
        ( SELECT MAX(orderdate)
                FROM orders
                GROUP BY (DATE_FORMAT(orderdate,'%Y%m'))
        )

子查询通过把订单按月分组并返回每个分组中最大的日期结果,这就是每个月最后订单生成的日期。而后外部查询通过子查询获得的日期来取得所有的订单信息。

这个问题看似得到了解决,实际上并没有这么简单。因为在这个数据量并不大的数据库中执行上述SQL语句竟然需要6.08秒,如果我们用EXPLAIN来对语句进行分析,就可以找到问题的所在——独立子查询被转化成了相关子查询。

这个是MySQL优化器对IN子查询优化时存在的一个问题,MySQL优化器对于IN语句的优化是“LAZY”的。对于IN子句,如果不是显式的列表定义,如IN('a','b','c'),那么IN子句都会被转换为EXISTS的相关子查询。

如果子查询和外部查询分别返回M和N行,那么该子查询被扫描为O(N+M*N)而不是O(M+N)。

因此,对于上述问题的SQL语句,MySQL数据库的优化器将其对应地转换为如下的相关子查询:

SELECT orderid,customerid,employeeid,orderdate
    FROM orders AS A
    WHERE EXISTS
        ( SELECT *
                FROM orders
                GROUP BY(DATE_FORMAT(orderdate,'%Y%M'))
                HAVING MAX(orderdate)= A.OrderDate
        );

需要注意的是,在大多数情况下,MySQL数据库都将独立子查询转换为相关子查询

不过对于上述语句,还是有一定的方法可以优化的。注意到慢的原因是独立子查询被转换成相关子查询,而这个相关子查询需要进行多次的分组操作。可以采取另一个方法,再嵌套一层子查询,避免多次的分组操作,语句如下:

SELECT orderid,customerid,employeeid,orderdate
    FROM orders A
    WHERE EXISTS
        ( SELECT * FROM (SELECT MAX(orderdate) AS orderdate
                FROM orders
                GROUP BY (DATE_FORMAT(orderdate,'%Y%M')) ) B
                WHERE A.orderdate = B.orderdate
        );

相关子查询

相关子查询是指引用了外部查询列的子查询,即子查询会对外部查询的每行进行一次计算。

举个例子,要查询每个员工最大订单日期的订单,因为一个员工可能有多个订单具有相同的订单日期,所以可能会为每个员工返回多行数据。

在这个例子中,子查询必须关联外部查询,将内部查询的employeeid与外部的employeeid进行匹配:

SELECT orderid,customerid,employeeid,orderdate,requireddate
    FROM orders AS A
    WHERE orderdate =
        ( SELECT MAX(orderdate) FROM orders AS B
                WHERE A.employeeid=B.employeeid);

不过因为执行了大量逻辑IO,该语句运行速度过慢,有什么方式可以优化呢?

首先,我们可以考虑添加一个唯一索引来加快处理速度:

CREATE UNIQUE INDEX idx_empid_od_rd_oid
    ON orders(employeeid,orderdate,requireddate,orderid)

速度得到了一定的提升,然而问题仍然是相关子查询需要与外部子查询的列进行多次比较。

为了避免子查询与外部子查询的多次比较操作,对于相关子查询,有时可以通过派生表来进行重写,对于以上SQL我们可以重写为:

SELECT
        A.orderid,A.customerid,A.employeeid,
        B.orderdate,requireddate
    FROM orders AS A,
    (SELECT employeeid,MAX(orderdate) AS orderdate FROM orders
    GROUP BY employeeid) AS B
    WHERE A.employeeid=B.EmployeeID AND A.OrderDate=B.orderdate;

这时没有了相关子查询的执行过程,逻辑IO大大减少了,同时也能用到索引,执行速度得到了很大提升。

EXISTS谓词

EXISTS是一个非常强大的谓词,它允许数据库高效地检查指定查询是否产生某些行。通常EXISTS的输入是一个子查询,并关联到外部查询,但这不是必须的。根据子查询是否返回行,该谓词返回TRUE或FALSE。与其他谓词和逻辑表达式不同的是,无论输入子查询是否返回行,EXISTS都不会返回UNKNOWN。如果子查询的过滤器为某行返回UNKNOWN,则表示该行不返回,因此,这个UNKNOWN被认为是FALSE。

目前在绝大多数的情况下,IN和EXISTS都具有相同的执行计划。但是要注意的是,NOT IN和NOT EXISTS具有非常不同的执行计划。

EXISTS与IN的一个区别体现在对三值逻辑的判断上。EXISTS总是返回TRUE或FALSE,而对于IN,除了TRUE、FALSE值外,还有可能对NULL值返回UNKNOWN。但是在过滤器中,UNKNOWN的处理方式与FALSE相同,因此使用IN与使用EXISTS一样,SQL优化器会选择相同的执行计划。

但是输入列表中包含NULL值时,NOT EXISTS和NOT IN之间的差异就表现得非常明显了。输入列表中包含NULL值时,IN总是返回TRUE和UNKNOWN,因此NOT IN总是返回NOT TRUE和NOT UNKNOWN,即FALSE和UNKNOWN。而对于NOT EXISTS,其总是返回TRUE和FALSE。

个人心得:对于“非存在型”问题,使用NOT EXISTS谓词,其余使用关联子查询的场景应该尽可能改写成关联派生表的方式,并添加合适的索引。

今天带大家了解了MySQL的相关知识,希望对你有所帮助;关于数据库的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

版本声明
本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
php:input提交表单时内容中包含单引号导致mysqli报错php:input提交表单时内容中包含单引号导致mysqli报错
上一篇
php:input提交表单时内容中包含单引号导致mysqli报错
Mysql exists用法小记
下一篇
Mysql exists用法小记
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 笔灵AI生成答辩PPT:高效制作学术与职场PPT的利器
    笔灵AI生成答辩PPT
    探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
    20次使用
  • 知网AIGC检测服务系统:精准识别学术文本中的AI生成内容
    知网AIGC检测服务系统
    知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
    29次使用
  • AIGC检测服务:AIbiye助力确保论文原创性
    AIGC检测-Aibiye
    AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
    35次使用
  • 易笔AI论文平台:快速生成高质量学术论文的利器
    易笔AI论文
    易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
    43次使用
  • 笔启AI论文写作平台:多类型论文生成与多语言支持
    笔启AI论文写作平台
    笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
    36次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码