当前位置:首页 > 文章列表 > 数据库 > MySQL > 【一文秒懂】带你彻底搞懂范式与反范式数据库设计

【一文秒懂】带你彻底搞懂范式与反范式数据库设计

来源:SegmentFault 2023-01-21 21:10:43 0浏览 收藏

小伙伴们对数据库编程感兴趣吗?是否正在学习相关知识点?如果是,那么本文《【一文秒懂】带你彻底搞懂范式与反范式数据库设计》,就很适合你,本篇文章讲解的知识点主要包括MySQL、数据库、后端、数据库设计、范式。在之后的文章中也会多多分享相关知识点,希望对大家的知识积累有所帮助!

图怪兽_9ef789cda64e9ae362106336d3fb4f69_18188.jpg

范式

image.png

范式就是前辈通过不断的验证给到的为了建立冗余较小、结构合理的数据库,是设计数据库必须遵循的一定规则,在关系型数据库中这种规格叫做范式,本篇不仅说明范式设计,也会给到一些例子,带着各位一起分析给到的数据表设计属于第几范式。

1NF 第一范式

image.png

遵循的规则:每一列属性都是不可再分的属性值,确保每一列的原子性

啥玩意是不再可分?例如用户名、性别、年龄联系方式则就是不能再分了。
但例如城市,北京市通州区,我们还是可以再分的,将一个字段分为省:北京市 区:通州区

首先,我们看到用户信息表中,所在城市是可以在进行细分的。
编码用户名年龄性别联系方式所在城市
1张三181888888888山东省青岛市
2李四171999999999湖北省武汉市
3王五221777777777山东省青岛市
下表我们根据上述用户信息表,将城市分为省和市两个字段,这样设计后,该数据表则符合了第一范式的要求。
用户编码用户名年龄性别联系方式所在省所在市
1张三181888888888山东省青岛市
2李四171999999999湖北省武汉市
3王五221777777777山东省青岛市

我们再以商品表做一个说明

编码商品名称价格库存制造工厂
1iPhone 13 白色1999100台湾富士康
2iPhone 12 黑色129920北京富士康
3iPhone 13 红色223930上海英华达

依旧是依照上述规则,首先我们找到已无法再次分割的属性

现在不可再分割的属性有 编码、价格(以只有RMB为准)、库存,而商品名称及制造工厂想必大家也知道,这是可以再分的属性吧,那么看下方符合第一范式的数据表设计

编码品牌型号颜色价格库存制造工厂(所在城市)制造工厂名称
1iPhone13白色1999100台湾富士康
2iPhone12黑色129920北京富士康
3iPhone13红色223930上海英华达

我们将商品名称与制造工厂进行以下的拆分,以达到不可再分的属性

其关系模式为:

商品名称(品牌,型号,颜色)
制造工厂(制造工厂所在城市,制造工厂名称)


看到这里,想必你已经搞懂第一范式的设计规则了,那么我们继续第二范式的学习。

2NF 第二范式

image.png

遵循的规则:首先必须符合第一范式要求,其次一个表中只能保存一种数据,确保每一列都与主键相关,我们以课程编码为主键,除课程名称以外的其他信息与主键无关,所以我们只需要独立课程编码与课程名称,其他则新建一张表。

课程编码课程名称讲授老师老师性别老师联系方式
10001C++程序设计张三1888888888
10002数据结构李四1999999999
10003操作系统王五1777777777

课程表

课程编码课程名称
10001C++程序设计
10002数据结构
10003操作系统

老师表

课程编码讲授老师老师性别老师联系方式
10001张三1888888888
10002李四1999999999
10003王五1777777777

这样拆分后,我们就符合了第二范式的要求,并且也符合第一范式的要求,没有可再分的属性。


我们再以上述符合第一范式的商品表为例

编码品牌型号颜色价格库存制造工厂(所在城市)制造工厂名称
1iPhone13白色1999100台湾富士康
2iPhone12黑色129920北京富士康
3iPhone13红色223930上海英华达

这里以编码和品牌为联合主键,与主键无关的属性新建立一张表。

生产商表

编码制造工厂(所在城市)制造工厂名称
1台湾富士康
2北京富士康
3上海英华达

商品表

编码品牌型号颜色价格库存生产商编码
1iPhone13白色19991001
2iPhone12黑色1299202
3iPhone13红色2239303

这样既符合了第二范式要求。

我们已经对第二范式有了一个大概得了解,不要停,第三范式在等你!

3NF 第三范式

遵循的规则:要先符合第二范式的要求,并且除主键列的其它列之间,不能有传递依赖关系。

这里先解释下,啥是传递依赖,以下列订单表为例 ,我们通过订单编码可以查到商品名称,但通过商铺编码也可以查找到发货仓及联系方式。既订单编码->发货仓,商铺编码->发货仓,这则产生传递依赖,通俗点讲究是如果除了主键(订单编码)外,不能再有有属性相关的非主键(商铺编码|发货仓),我们只能通过主键查到所有信息,达到独占的情况,意味着下条SQL语句不能让他有效,则就达到了第三范式的要求。

SELECT 发货仓,店铺电话 FROM 订单表 WHERE 商铺编码 = S1
订单编码商品名称商铺编码发货仓店铺电话
NS001小米手机S1某东华北发货仓1888888888
NS002三星手机S2某猫华东发货仓1999999999
NS003华为手机S3某多华西发货仓1777777777

根据下述拆分达到第三范式要求

订单表

订单编码商品名称商铺编码
NS001小米手机S1
NS002三星手机S2
NS003华为手机S3

商铺表

商铺编码发货仓店铺电话
S1某东华北发货仓1888888888
S2某猫华东发货仓1999999999
S3某多华西发货仓1777777777

刚刚讲到第三范式一定满足第二范式,而第一范式一定满足第一范式,那么我们看下刚刚拆好的订单表

  1. 无再可拆分的属性,符合第一范式。
  2. 无与主键无关属性,符合第二范式。
  3. 无传递依赖关系,符合第三范式。

所以说,当你符合第三范式时,你实际已经符合了第一第二范式,那么关系型数据库的三大范式我们就讲到这里,数据中可能有些歧义,请理解原理,勿细纠结,谢谢。

反范式设计的目的

当然范式只是提出的规范,但一些特殊情况下,我们要考虑的点比较多,例如

  1. 并发读。
  2. 减少表关联次数。
  3. 数据表的冗余设计。
  4. 热数据与冷数据。
  5. 数据的非实时性。

这里与三大范式做一个对比(个人见解)

  • 减少表关联次数 = 违反了第二范式
  • 数据表的冗余设计 = 违反了第三范式

当然也不是一概而论,这里以订单表为导向,来讲解一下为什么我们会迫不得已违反范式规则。


image.png

这里做出一个提问
用户下单后,商品的基本信息如果进行表关联的方式,既订单表的商品编码关联商品表的编码,会出现什么问题?

大概会出现这样一个问题:

image.png

用户购买了一台HP打印机1999元后,商家对当前这个商品进行了修改,改为了一台华硕笔记本,那么通过表关联(设符合范式规则),用户会不会疯掉?

image.png

那么如何解决这一问题?

这就使用了我上述提出的数据的冗余设计,将商品基本信息直接存入订单表中,这是根据常识而定的,就跟你去商场买了一个西瓜花了20元,次日这个西瓜无论涨价还是降价,商场不会要求你补足差价,你也无法要求商场返还差价(当然这与某东买贵包赔无关,不要较劲)。

image.png

那么在互联网的时代,当你下单的那一时刻,你购买的商品信息则就已经固定,无论商家是修改商品,还是删掉商品,或者商家倒闭了关闭店铺。你购买的商品永远会在你的订单内看到,当然如果商品失效,你在点击进入后,某宝可能会给到你一个快照,这个快照依旧是在你下单时保存的数据。

你现在应该可以理解,为什么需要反范式,类似的例子还有很多,我在我的电商设计相关文章内有多次提出类似的需求,至此我就不一一例举了

当然在正常情况下,你依旧需要根据三大范式去设计你的业务,这是行业规范,只有规范统一,你才不会“坑”你的接班人。


那么反范式设计的优点有哪些呢?

  1. 提高查询速度。
  2. 避免多表查询。
  3. 降低数据库的压力。

反范式应该注意的问题

image.png
  1. 过多冗余数据导致存储量过大。
  2. 必要时需配合内存数据库实行。
  3. 违反了范式规则,会出现插入异常、查询异常等。

致谢

感谢你看到这里,希望本篇可以帮助到你,谢谢。

图怪兽_aca660f7aa40e1eb9fb2ce7d8b804a59_89437.jpg

文中关于mysql的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《【一文秒懂】带你彻底搞懂范式与反范式数据库设计》文章吧,也可关注golang学习网公众号了解相关技术文章。

版本声明
本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
MySQL学习笔记-2-事务MySQL学习笔记-2-事务
上一篇
MySQL学习笔记-2-事务
pymysql 读取记录的时候怎么知道是什么数据类型?
下一篇
pymysql 读取记录的时候怎么知道是什么数据类型?
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 笔灵AI生成答辩PPT:高效制作学术与职场PPT的利器
    笔灵AI生成答辩PPT
    探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
    23次使用
  • 知网AIGC检测服务系统:精准识别学术文本中的AI生成内容
    知网AIGC检测服务系统
    知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
    35次使用
  • AIGC检测服务:AIbiye助力确保论文原创性
    AIGC检测-Aibiye
    AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
    37次使用
  • 易笔AI论文平台:快速生成高质量学术论文的利器
    易笔AI论文
    易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
    47次使用
  • 笔启AI论文写作平台:多类型论文生成与多语言支持
    笔启AI论文写作平台
    笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
    40次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码