当前位置:首页 > 文章列表 > 数据库 > MySQL > Mysql性能优化:如何给字符串加索引?

Mysql性能优化:如何给字符串加索引?

来源:SegmentFault 2023-02-16 15:20:46 0浏览 收藏

IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《Mysql性能优化:如何给字符串加索引?》,聊聊MySQL,我们一起来看看吧!

导读

  • 现代大部分的登录系统都支持邮箱、手机号码登录两种方式,那么如何在邮箱或者手机号码这个字符串上建立索引才能保证性能最佳呢?
  • 今天这篇文章就来探讨一下在Mysql中如何给一个字符串加索引才能达到性能最佳。
  • 本文首发于作者的微信公众号【码猿技术专栏】,原创不易,喜欢的朋友支持一下,谢谢!!!
  • 陈某将会从什么是前缀索引前缀索引和普通索引的比较如何建丽最佳性能的前缀索引前缀索引对覆盖索引的影响这几段来讲。

前缀索引

  • 顾名思义,对于列值较长,比如
    BLOB
    TEXT
    VARCHAR
    ,就 "必须" 使用前缀索引,即将值的前一部分作为索引。因为索引的存储也是需要空间的,同样索引太长维护起来也比较困难。
  • 比如我们给
    User
    表中的邮箱添加前缀索引,如下:

    alter table user add index index1(email(7));

  • 上述语句将email的前7个字符作为索引。

前缀索引和普通索引比较

  • 我们分别将
    email
    的全部作为索引和前7个字符作为索引来看看在性能上有什么差异。建立索引的语句如下:

  alter table user add index index1(email);

  alter table user add index index2(email(7));

  • 假设有
    user
    表中有这样几条数据(id,name,email):
    (1,"陈某","chenmou1993@xxx")
    (2,"张某","chenmou1994@xxx")
    (3,"李某","chenmou1995@xxx")
    (4,"王某","chenmou1996@xxx")
  • 对应于index1和index2的索引树如下两张图:

  • 如果执行下面的查询语句,Mysql如何利用索引来查询呢?

  select * from user where email="chenmou1995@xxx";

【1】普通索引的执行过程

  1. 从index1索引树找到满足索引值是
    chenmou1995@xxx
    的这条记录,取得
    id=2
    的值;
  2. 到主键上查到主键值是
    id=2
    的行,判断email的值是正确的,将这行记录加入结果集;
  3. index1
    索引树上刚刚查到的位置的下一条记录,发现已经不满足
    email=chenmou1995@xxx
    的条件了,循环结束。

这个过程中,只需要回主键索引取一次数据,所以系统认为只扫描了一行

【2】前缀索引的执行过程

  1. 从index2索引树找到满足索引值是
    chenmou
    的记录,找到的第一个是id=1;
  2. 到主键上查到主键值是id=1的行,判断出email的值不是
    chenmou1995@xxx
    ,这行记录丢弃;
  3. 取index2上刚刚查到的位置的下一条记录,发现仍然是
    chenmou
    ,取出id=2,再到ID索引上取整行然后判断,这次值对了,将这行记录加入结果集;
  4. 重复上一步,直到在idxe2上取到的值不是
    chenmou
    时,循环结束。

  在这个过程中,要回主键索引取4次数据,也就是扫描了4行。

  • 通过以上查询的对比,很容易就可以发现,使用前缀索引后,可能会导致查询语句读数据的次数变多。
  • 但是对于这个查询语句来说,如果建立的前缀索引的长度为13呢?那么满足
    chenmou1995
    的记录只有一个,这样就可以直接定位到
    id=2
    ,此时不但空间缩小了,扫描的行数也减少了。
  • 于是结论就来了:使用前缀索引,只要定义好长度,就可以做到既节省空间,又不用额外增加太多的查询成本。
  • 那么如何建立正确的前缀索引才能达到最佳的性能呢?接着往下看................

如何建立最佳性能的前缀索引

  • 通过上述的比较,可以得出一个结论,建立前缀索引的区分度越高越好,意味着重复的键值越少
  • 那么如何统计区分度,其实很简单,只需要判断数据库中重复的次数即可。sql如下:

  select
   count(distinct left(email,4))as L4,
   count(distinct left(email,5))as L5,
   count(distinct left(email,6))as L6,
   count(distinct left(email,7))as L7,
  from user;

  • 但是如果对于使用前缀区分度不太好的情况,比如,我们国家的身份证号,一共18位,其中前6位是地址码,所以同一个县的人的身份证号前6位一般会是相同的。 这时候如果对身份证号做长度为6的前缀索引的话,这个索引的区分度就非常低了。
  • 按照我们前面说的方法,可能你需要创建长度为12以上的前缀索引,才能够满足区分度要求。
  • 但是,索引选取的越长,占用的磁盘空间就越大,相同的数据页能放下的索引值就越少,搜索的效率也就会越低。
  • 那么,如果我们能够确定业务需求里面只有按照身份证进行等值查询的需求,还有没有别的处理方法呢?这种方法,既可以占用更小的空间,也能达到相同的查询效率。现在简单的介绍一种解决此种问题的方式,当然方法肯定不止一种,如下:

  倒序存储

  如果你存储身份证号的时候把它倒过来存,每次查询的时候,你可以这么写:

  select field_list from t where id_card = reverse('输入的身份证号');

  由于身份证号的最后6位没有地址码这样的重复逻辑,所以最后这6位很可能就提供了足够的区分度。当然了,实践中你不要忘记使用

count(distinct)
方法去做个验证。

前缀索引对覆盖索引的影响

  • 前缀索引会导致覆盖索引失效,查询语句如下:

  select id,name from user where email="chenmou1995@xxx";

  • 由于使用了前缀索引,因此必须会回表验证查询到的时候正确,此处使用了覆盖索引也是无效的。
  • 也就是说,使用前缀索引就用不上覆盖索引对查询性能的优化了,这也是你在选择是否使用前缀索引时需要考虑的一个因素。

总结

  • 如何给字符串加索引是一个需要考量的问题,陈某在这里给出如下的建议:
  1. 如果字符串长度很短,建议直接用全部作为索引。
  2. 使用前缀索引注意分析区分度,区分度越高越好。
  3. 使用前缀索引需要考虑覆盖索引失效的问题。

理论要掌握,实操不能落!以上关于《Mysql性能优化:如何给字符串加索引?》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

版本声明
本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
mysql char varchar 介绍mysql char varchar 介绍
上一篇
mysql char varchar 介绍
Centos7在线安装和配置MySQL5.7
下一篇
Centos7在线安装和配置MySQL5.7
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    3179次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    3390次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    3419次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    4525次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    3798次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码