当前位置:首页 > 文章列表 > 数据库 > MySQL > Mysql性能优化:如何给字符串加索引?

Mysql性能优化:如何给字符串加索引?

来源:SegmentFault 2023-02-16 15:20:46 0浏览 收藏

IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《Mysql性能优化:如何给字符串加索引?》,聊聊MySQL,我们一起来看看吧!

导读

  • 现代大部分的登录系统都支持邮箱、手机号码登录两种方式,那么如何在邮箱或者手机号码这个字符串上建立索引才能保证性能最佳呢?
  • 今天这篇文章就来探讨一下在Mysql中如何给一个字符串加索引才能达到性能最佳。
  • 本文首发于作者的微信公众号【码猿技术专栏】,原创不易,喜欢的朋友支持一下,谢谢!!!
  • 陈某将会从什么是前缀索引前缀索引和普通索引的比较如何建丽最佳性能的前缀索引前缀索引对覆盖索引的影响这几段来讲。

前缀索引

  • 顾名思义,对于列值较长,比如
    BLOB
    TEXT
    VARCHAR
    ,就 "必须" 使用前缀索引,即将值的前一部分作为索引。因为索引的存储也是需要空间的,同样索引太长维护起来也比较困难。
  • 比如我们给
    User
    表中的邮箱添加前缀索引,如下:

    alter table user add index index1(email(7));

  • 上述语句将email的前7个字符作为索引。

前缀索引和普通索引比较

  • 我们分别将
    email
    的全部作为索引和前7个字符作为索引来看看在性能上有什么差异。建立索引的语句如下:

  alter table user add index index1(email);

  alter table user add index index2(email(7));

  • 假设有
    user
    表中有这样几条数据(id,name,email):
    (1,"陈某","chenmou1993@xxx")
    (2,"张某","chenmou1994@xxx")
    (3,"李某","chenmou1995@xxx")
    (4,"王某","chenmou1996@xxx")
  • 对应于index1和index2的索引树如下两张图:

  • 如果执行下面的查询语句,Mysql如何利用索引来查询呢?

  select * from user where email="chenmou1995@xxx";

【1】普通索引的执行过程

  1. 从index1索引树找到满足索引值是
    chenmou1995@xxx
    的这条记录,取得
    id=2
    的值;
  2. 到主键上查到主键值是
    id=2
    的行,判断email的值是正确的,将这行记录加入结果集;
  3. index1
    索引树上刚刚查到的位置的下一条记录,发现已经不满足
    email=chenmou1995@xxx
    的条件了,循环结束。

这个过程中,只需要回主键索引取一次数据,所以系统认为只扫描了一行

【2】前缀索引的执行过程

  1. 从index2索引树找到满足索引值是
    chenmou
    的记录,找到的第一个是id=1;
  2. 到主键上查到主键值是id=1的行,判断出email的值不是
    chenmou1995@xxx
    ,这行记录丢弃;
  3. 取index2上刚刚查到的位置的下一条记录,发现仍然是
    chenmou
    ,取出id=2,再到ID索引上取整行然后判断,这次值对了,将这行记录加入结果集;
  4. 重复上一步,直到在idxe2上取到的值不是
    chenmou
    时,循环结束。

  在这个过程中,要回主键索引取4次数据,也就是扫描了4行。

  • 通过以上查询的对比,很容易就可以发现,使用前缀索引后,可能会导致查询语句读数据的次数变多。
  • 但是对于这个查询语句来说,如果建立的前缀索引的长度为13呢?那么满足
    chenmou1995
    的记录只有一个,这样就可以直接定位到
    id=2
    ,此时不但空间缩小了,扫描的行数也减少了。
  • 于是结论就来了:使用前缀索引,只要定义好长度,就可以做到既节省空间,又不用额外增加太多的查询成本。
  • 那么如何建立正确的前缀索引才能达到最佳的性能呢?接着往下看................

如何建立最佳性能的前缀索引

  • 通过上述的比较,可以得出一个结论,建立前缀索引的区分度越高越好,意味着重复的键值越少
  • 那么如何统计区分度,其实很简单,只需要判断数据库中重复的次数即可。sql如下:

  select
   count(distinct left(email,4))as L4,
   count(distinct left(email,5))as L5,
   count(distinct left(email,6))as L6,
   count(distinct left(email,7))as L7,
  from user;

  • 但是如果对于使用前缀区分度不太好的情况,比如,我们国家的身份证号,一共18位,其中前6位是地址码,所以同一个县的人的身份证号前6位一般会是相同的。 这时候如果对身份证号做长度为6的前缀索引的话,这个索引的区分度就非常低了。
  • 按照我们前面说的方法,可能你需要创建长度为12以上的前缀索引,才能够满足区分度要求。
  • 但是,索引选取的越长,占用的磁盘空间就越大,相同的数据页能放下的索引值就越少,搜索的效率也就会越低。
  • 那么,如果我们能够确定业务需求里面只有按照身份证进行等值查询的需求,还有没有别的处理方法呢?这种方法,既可以占用更小的空间,也能达到相同的查询效率。现在简单的介绍一种解决此种问题的方式,当然方法肯定不止一种,如下:

  倒序存储

  如果你存储身份证号的时候把它倒过来存,每次查询的时候,你可以这么写:

  select field_list from t where id_card = reverse('输入的身份证号');

  由于身份证号的最后6位没有地址码这样的重复逻辑,所以最后这6位很可能就提供了足够的区分度。当然了,实践中你不要忘记使用

count(distinct)
方法去做个验证。

前缀索引对覆盖索引的影响

  • 前缀索引会导致覆盖索引失效,查询语句如下:

  select id,name from user where email="chenmou1995@xxx";

  • 由于使用了前缀索引,因此必须会回表验证查询到的时候正确,此处使用了覆盖索引也是无效的。
  • 也就是说,使用前缀索引就用不上覆盖索引对查询性能的优化了,这也是你在选择是否使用前缀索引时需要考虑的一个因素。

总结

  • 如何给字符串加索引是一个需要考量的问题,陈某在这里给出如下的建议:
  1. 如果字符串长度很短,建议直接用全部作为索引。
  2. 使用前缀索引注意分析区分度,区分度越高越好。
  3. 使用前缀索引需要考虑覆盖索引失效的问题。

理论要掌握,实操不能落!以上关于《Mysql性能优化:如何给字符串加索引?》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

版本声明
本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
mysql char varchar 介绍mysql char varchar 介绍
上一篇
mysql char varchar 介绍
Centos7在线安装和配置MySQL5.7
下一篇
Centos7在线安装和配置MySQL5.7
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 笔灵AI生成答辩PPT:高效制作学术与职场PPT的利器
    笔灵AI生成答辩PPT
    探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
    13次使用
  • 知网AIGC检测服务系统:精准识别学术文本中的AI生成内容
    知网AIGC检测服务系统
    知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
    22次使用
  • AIGC检测服务:AIbiye助力确保论文原创性
    AIGC检测-Aibiye
    AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
    30次使用
  • 易笔AI论文平台:快速生成高质量学术论文的利器
    易笔AI论文
    易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
    38次使用
  • 笔启AI论文写作平台:多类型论文生成与多语言支持
    笔启AI论文写作平台
    笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
    35次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码