如何打造一款NewSQL + MySQL的分布式数据库?
知识点掌握了,还需要不断练习才能熟练运用。下面golang学习网给大家带来一个数据库开发实战,手把手教大家学习《如何打造一款NewSQL + MySQL的分布式数据库?》,在实现功能的过程中也带大家重新温习相关知识点,温故而知新,回头看看说不定又有不一样的感悟!
对分布式数据库感兴趣的朋友都知道,谷歌的 F1 和 Spanner ***了 NewSQL 技术的发展,于是很多公司去做 NewSQL,导致好多人认为基于 MySQL 的分布式数据库过时了。
其实不然,MySQL 并没有过时,本篇文章的主角 —— RadonDB ,就是把 NewSQL 领域比较流行的分布式一致性算法和 MySQL 结合起来,形成了新一代的分布式数据库 MyNewSQL,同样做到了可扩展、高可用、强一致、易部署的特点。
那么,如何将 NewSQL 领域比较流行的技术和 MySQL 结合起来,打造一款新的分布式数据库?
1、RadonDB 的架构

首先看一下 RadonDB 的架构,如上图所示,上半部分是分布式的 SQL 层,下面是存储层,如果我们对 F1 和 Spanner 进行抽象之后,会发现也都是这两层。
其中 SQL 层主要负责对用户 SQL 解析,然后生成分布式的执行计划和执行器,再把这些执行器下发到具体的存储节点去执行。
虽然架构看上去比较一致,但 RadonDB 比较特殊的一点是:下面的存储层有多个存储节点。图中每个圆圈里面都是一个存储节点,每个存储节点有三副本,三副本之间就是一个 Raft 协议进行数据同步,每个副本都是一个 MySQL。而其他 NewSQL 就是一个 KV 或者其他的存储。
2、RadonDB 架构层解析
下面详细阐述一下架构里面的各个技术点。
SQL 节点

首先来看一下 SQL 节点。
用户请求到达 SQL 节点后,我们根据数据的分布规则生成一个分布式的执行计划,告诉用户的 SQL 要分发到哪些存储节点,然后根据分布式执行计划生成一个分布式的执行器,就是具体到哪些存储节点进行链接、执行、返回。
执行完之后 SQL 节点就会做二次运算,为什么叫二次运算?因为下面是 MySQL,SQL 节点把计算推到 MySQL 之后,SQL 节点再进行二次运算,包括 limit/groupby/aggregation/join。
所以说,SQL 节点是一个无中心化、无状态的,扩容性强。
3、存储层

存储层由多个 Node 组成,每个 Node 就是一主两从的 MySQL,但这个 MySQL 比较特殊,因为 MySQL 没有一个高可用的方案,可能大家都是 MHA 或者自己写一个主从切换脚本来运维。
但是 RadonDB 引入了 Raft 协议,它是无中心化的, 当主库挂了后,通过 Raft 协议选择新主,而数据同步则基于 MySQL GTID 机制。
基于 MySQL 的好处是不仅有存储能力还有计算能力,如果一个副本只是一个 KV ,他的计算能力就比较有限,SQL 层把数据推到存储层,然后再返回 SQL 节点再进行运算,这样存储层和 SQL 层交互就会比较多。
我们尽量把计算能力下推到存储层让 MySQL 完成,因为 MySQL 跟数据是在一块的,不涉及网络传输,只需要几个 I/O 就将数据过滤掉了。
4、数据分布

刚才说了 SQL 层和存储层,再看一下数据怎么分布?
建一个 T1 表,后面指定的分区方式是 HASH,在 RadonDB 里面默认整张表共 4096 slots, 每个小表默认是 128 slots, 其实就是一个大表分成 32 个小表,比如两个存储节点,这个 T1 表的 32 个小表,前 16 个小表在***个存储节点上,后 16 个小表是在第二个节点上,是均分布的。
可能很多人认为基于 MySQL 扩容是个问题,但是如上所说,表分完之后,RadonDB 以小表为单位做数据迁移,所以扩容非常方便。如果是加了一个新的节点,RadonDB 就会把动态的一些小表迁移到新的节点上,因为我们是基于 MySQL 做的,首先会做一个全量,然后把位点记下来,等全量做完再追增量,这个迁移过程基本不影响业务了。
所以这样每个小表就可以在多个存储节点上动态的漂移。这些迁移规则也可以进行自定制,比如说先迁移较大的表或者热度比较高的表,让整体资源分配最快达到***化。
5、如何保障高可用?

一个存储节点内三个副本怎么保证高可用的?我们将分布式一致性算法 Raft 和 MySQL 自身的 GTID 结合起来。
Raft 主要做两件事,一个是选主,第二个是数据同步。MySQL 5.7 GTID,类似于 Raft 里面的一个 log index, 数据同步是通过 GTID,选主是通过 Raft,我们开发了一套 Raft 框架,实时监测 MySQL 状态,如果主不正常了,就发起重新选主。
选完后新主与其他两个从库数据怎么同步呢?两个从根据自己的 GTID 向主那去拉数据,进行数据同步。MySQL 5.7 可以并行复制,过程非常迅速,主从基本没有延迟,在高压情况下延迟也非常小。而且,通过比较强的 semi-sync 确保事务不丢失。
存储节点里 Raft 和 GTID 是没有中心化的,可以跨机房部署,非常灵活。
6、分布式事务
下面看一下分布式事务,为什么分布式数据库需要分布式事务呢?
因为数据在存储节点是分布式存储的,比如说一个表在节点 1、节点 2、节点 3 都有存储,然后执行了一个操作,在节点 1 成功了,在节点 2 失败了,节点 3 成功了。这时如果没有分布式事务,那这个表其实是坏的。
如果没有分布式事务保证的话,数据随时都处于不可用的状态,只能用来存不重要的业务。
所以 RadonDB 就提供了分布式事务,比如说刚才这个情况,就是 2 失败之后,这个 1 和 3 存储节点自动回滚,这是分布式事务保障。
RadonDB 分布式事务也是基于 MySQL 实现的,在 MySQL 里面分两阶段提交。
首先它会做 xa start,然后执行 SQL,做 xa end,第四做 xa prepare,这是***阶段,此时事务才会从副本复制过去;第二个阶段是 xa commit。
所以 RadonDB 在 SQL 层进行了事务管理,把 MySQL 的五个步骤抽象成三个,***是 Begin,第二是执行,第三是提交,如果 Prepare 失败,可以进行 Rollback。
提到分布式事务,大家可能会问,这个事务是什么隔离级别?
RadonDB 实现 Snapshot Isolation 也就是快照隔离级别,这是个什么概念呢?当部分分区没有提交时,这个事务对其他事务不可见,这就是部分提交不可见。另外就是未提交不可见,也就是说做了 prepare,但没有 Commit,那也是不可见的。
7、SI 隔离级别

大家可以看一下上图右边两个 SQL 语句,两个 Client 连上来,一个 Client 是扫表,第二个 SQL 语句就是不停更新这个表。
对于 SI 隔离级别我们用了 XeLabs/go-jepsen ,1 个更新线程,16 扫表线程,通过 100 多亿次操作和监测没有发现问题,并且可以随机 KILL 存储节点主副本,这些都证明 MySQL XA 已经很强大了。
RadonDB 还支持 HTAP 混合模式,在传统的解决方案里,一般都是两套系统,就是两个端口。在需要事务和需要分析的时候,分别在两个端口处理,中间通过ETL通道进行数据同步。
但是,在 RadonDB 里就一个端口,如果是 OLAP 的操作,我们会自动路由到计算节点,而且 OLTP 和 OLAP 这两个计算的资源是隔离的,互不影响。
8、性能

***看一看 RadonDB 的性能。上图是单机 MySQL 和四个存储节点的 RadonDB 的对比。
我们用 sysbench 16 个表、512 个线程,随机写了 5000 万条数据,测试得出来的结果,RadonDB 基本上可以做到 26589 TBS,单机是 9346 TBS,可以看到在 TBS 层面 RadonDB 性能将近是单机的三倍,延迟却只有的三分之一。
这就是分布式数据库的威力,性能和容量可以通过节点的增加而线性增长。
作者简介

张雁飞,青云QingCloud 数据库高级技术专家。TokuDB 内核贡献者、维护者,TokuDB 企业级热备工具作者。
终于介绍完啦!小伙伴们,这篇关于《如何打造一款NewSQL + MySQL的分布式数据库?》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布数据库相关知识,快来关注吧!

- 上一篇
- go如何将两个切片转化为一段json?

- 下一篇
- go+gin 静态资源路由与后端api路由冲突如何解决?
-
- 数据库 · MySQL | 1天前 |
- MySQL设置中文界面,超简单教程来了!
- 332浏览 收藏
-
- 数据库 · MySQL | 1天前 | mysql 索引提示
- MySQL进阶必看!FORCE/USE/IGNOREINDEX用法大揭秘
- 182浏览 收藏
-
- 数据库 · MySQL | 1天前 |
- 手把手教你写MySQL存储过程,小白也能轻松上手
- 163浏览 收藏
-
- 数据库 · MySQL | 1天前 | mysql group by
- MySQL分组查询优化:GROUPBY原理+索引优化超全解析
- 324浏览 收藏
-
- 数据库 · MySQL | 2天前 |
- MySQL设置中文语言,轻松拥有中文界面
- 211浏览 收藏
-
- 数据库 · MySQL | 2天前 |
- MySQL建库语句从入门到精通:创建数据库+设置字符集&排序规则(附实例)
- 176浏览 收藏
-
- 数据库 · MySQL | 2天前 |
- 从零开始学MySQL数据库操作,小白轻松变大神!
- 496浏览 收藏
-
- 数据库 · MySQL | 2天前 |
- MySQL插入日期到时间字段,轻松搞定日期格式
- 484浏览 收藏
-
- 数据库 · MySQL | 2天前 | mysql 数据压缩
- MySQL怎么实现高效压缩存储?表压缩+列式存储详细解读
- 272浏览 收藏
-
- 数据库 · MySQL | 2天前 | mysql JOIN优化
- MySQL优化JOIN操作:七大技巧教你提升关联查询速度
- 106浏览 收藏
-
- 数据库 · MySQL | 2天前 |
- MySQL出现中文乱码?超详细解决方案一次性搞定
- 211浏览 收藏
-
- 数据库 · MySQL | 2天前 |
- MySQL主从复制这样配!搞懂这些参数,replication稳了~
- 131浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 21次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 50次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 58次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 53次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 59次使用
-
- golang MySQL实现对数据库表存储获取操作示例
- 2022-12-22 499浏览
-
- 搞一个自娱自乐的博客(二) 架构搭建
- 2023-02-16 244浏览
-
- B-Tree、B+Tree以及B-link Tree
- 2023-01-19 235浏览
-
- mysql面试题
- 2023-01-17 157浏览
-
- MySQL数据表简单查询
- 2023-01-10 101浏览