利用go实现mysql批量测试数据生成-TDG
来到golang学习网的大家,相信都是编程学习爱好者,希望在这里学习数据库相关编程知识。下面本篇文章就来带大家聊聊《利用go实现mysql批量测试数据生成-TDG》,介绍一下MySQL、go、批量插入,希望对大家的知识积累有所帮助,助力实战开发!
利用go实现mysql批量测试数据生成-TDG
组件代码:https://gitee.com/dn-jinmin/tdg
下载
insert into table_name (col1,col2)values(data1, data2)
如果存在一份 xxx.sql 的文件可以通过
source xxx.sql
还可以采用mysql中的
load data xxx xxx.txt
针对mysql如何快速批量生成测试数据需要解决的几个问题
- 如何快速生成?
- 如何针对表生成
- 需要针对不同字段要求生成数据
- 可自定义对不同的表去生成
这是针对mysql如何高效的生成测试数据必须要考虑并要解决的问题,我的思考过程...(因为篇幅太长此处省略....N..字)
tdg实现思路
首先在整体的思路上是基于sql,通过insert的方式写入的策略实现的;利用insert语句批量新增的方式;如下格式
insert into table_name (col1,col2) values(data1, data2),(data1,data2)
tdg对于SQL的生成分为三块
1. SQL开始与table_name
insert into table_name
2. 字段列
(col1, col2)
3. 写入数据
values(data1, data2),(data1, data2)
tdg则就是针对SQL的生成与拼接组装最终构建一条批量新增的insert语句,将生成的数据写入到mysql中;
03. 具体实现
在整体的实现中可以分为四个节点:初始化、数据生成规则、SQL生成、SQL写入

数据生成规则
这里我们先了解一下规则是如何实现的,因为考虑到在mysql中对于字段我们会因为数据的特点会有对应的要求,比如id可以是int也可以是string、order会有属于它自己的要求方式,phone,date,name等等会存在多种类型的数据要求;
因此规则的设计主要是根据列的应用所对应的类型设计会包含如下的规则

这些规则会在初始化的时候加载;整体的设计上是定义一个统一的规则接口在
type Column struct { // 字段标签,确定字段生成方式 Tag string `json:"tag"` // 字段固定长度 Len int `json:"len"` // 长度范围,可变长度 FixedLen interface{} `json:"fixed_len"` // 字段最大值 Max int `json:"max"` // 字段最小值 Min int `json:"min"` // 其它参数 Params interface{} `json:"params"` // 默认值 Default struct { Value interface{} `json:"value"` Frequency int `json:"frequency"` } `json:"default"` // 指定随机内容 Content []interface{} `json:"content"` } type Tag interface { Name() string Handler(column *Column) string Desc() string }
Name() 代表是规则的标签名称,Hander具体的随机方法,Desc打印输出的描述;考虑到规则的丰富性定义一个统一的column结构体作为hander的参数,而不同规则可以根据column中的参数设置进行随机生成想要的结果; 如下为示例,
type Char struct{} func (*Char) Name() string { return "char" } func (*Char) Handler(column *Column) string { var ret strings.Builder chLen := column.Len // 固定长度, 固定长度优先级大于可变长度 if column.FixedLen != nil { chLen = column.PrepareFixedLen() } ret.Grow(chLen) // 可变长度 for i := 0; i
所有的规则统一定义在
type Field map[string]Tag func NewField(cap int) Field { return make(map[string]Tag, cap) } func (field Field) Register(tag string, option Tag) func (field Field) TagRandField(column *Column, sql *strings.Builder)
规则也可以自定义哟只需要实现上面的接口,然后再利用filed的Register方法注册就好了
初始化:
在tdg中存在Table结构体代表是某一个表
type Table struct { TableName string `json:"table_name"` Columns map[string]*Column `json:"columns"` Debug bool `json:"debug"` Count int `json:"count"` Status int `json:"status"` columns []string sqlPrefix *[]byte }
加载table.json配置,在配置中会定义关于MySQL的连接、table的表名、字段及整体tdg对数据生成的策略
{ "tdg": { "data_one_init_max_memory": 104857600, "build_sql_worker_num": 5, "insert_sql_worker_num": 10, "build_batches_count": 2000, // .. }, "mysql": { "addr": "", "user" : "", "pass" : "", "charset" : "", "dbname": "", "table_prefix": "" }, "tables": { "member": { "status": 0, "table_name": "member", "count": 10, "columns": { "username": { "tag": "name", "fixed_len": "6|14" }, //.. } }, "member_info": { "table_name": "member_info", "count": 1, "status": 0, "columns": { //.. } } } }
同时也会加载一些自定义的规则,加载后的数据信息会存最终存在build中,通过build驱动
type Build struct { oneInitMaxMemory int insertSqlWorkerNum int buildSqlWorkerNum int buildBatchesCount int mysqlDsn string cfg *Config tables map[string]*Table field Field db *gorm.DB wg sync.WaitGroup }
在初识的时候会对所有准备新增的表把前缀
func (b *Build) Run() { b.buildSqlWorkerPool(sqlCh, buildTaskCh) b.insertSqlWorkerPool(sqlCh, ctx) for _, table := range b.tables { go func(table *Table, ctx *Context) { // 数据表是否写入 if table.Status == -1 { return } task := &buildTask{ table: table, quantity: b.buildBatchesCount, sqlPrefix: table.prepareColumn(), } degree, feel := deg(table.Count, b.buildBatchesCount) ctx.addDegree(degree) // 统计次数 for i := 0; i 0 && i == degree -1 { task.quantity = feel } buildTaskCh
在流程的设计上是会对每个表分任务的方式去生成,一次生成多少的SQL并进行写入;通过deg计算任务,而任务信息就是buildTask通过通道buildTaskCh发送任务
同时在run中还会创建好对应insertSql与getSql的工作者数量
在getSql中会根据标签调用不同的规则生成,随机的数值并进行SQL的拼接
func (b *Build) getSql(quantity int, sqlPrefix *[]byte,table *Table, sqlCh chan *strings.Builder) { // .. for i := 0; i
在生成完SQL之后把结果发送到sqlch通道中;insertSql则读取并利用gorm写入
func (b *Build) insert(sql *strings.Builder, ctx *Context) { if !b.cfg.NoWrite { if err := b.db.Exec(sql.String()).Error; err != nil { if b.cfg.Debug { ctx.errs = append(ctx.errs, err) } if !b.cfg.TDG.SkipErr { ctx.Cancel() return } } } ctx.complete++ if ctx.complete == ctx.degree { ctx.Cancel() } }
基本实现如上
04. 总结
tdg中对于如下问题的解决
- 如何快速生成?(利用并发编程worker工作模式、构建多个getSQL与insertSql配合工作,细节可以看具体代码哟)
- 如何针对表生成(通过配置table.json指定,并且还需要指定生成的规则)
- 需要针对不同字段要求生成数据(通过定义规则的生成结构体及固定传参来提高生成规则的丰富度)
- 可自定义对不同的表去生成(同样也是table.json中可以指定,并且还可以支持多个表一起)
如果有哪儿存在问题的欢迎指点
终于介绍完啦!小伙伴们,这篇关于《利用go实现mysql批量测试数据生成-TDG》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布数据库相关知识,快来关注吧!

- 上一篇
- 高逼格的 SQL 写法:行行比较

- 下一篇
- 数据库设计——评论回复功能
-
- 虚幻的汉堡
- 这篇技术贴出现的刚刚好,太全面了,很好,码住,关注作者了!希望作者能多写数据库相关的文章。
- 2023-06-18 02:46:09
-
- 数据库 · MySQL | 9小时前 |
- MySQL排序优化与性能提升技巧
- 153浏览 收藏
-
- 数据库 · MySQL | 10小时前 |
- MySQL中WHERE与HAVING的区别详解
- 340浏览 收藏
-
- 数据库 · MySQL | 16小时前 |
- MySQL排序优化与性能提升技巧
- 368浏览 收藏
-
- 数据库 · MySQL | 1天前 |
- MySQL连接池配置与优化方法
- 297浏览 收藏
-
- 数据库 · MySQL | 1天前 |
- MySQLGROUPBY使用技巧与常见问题
- 306浏览 收藏
-
- 数据库 · MySQL | 1天前 |
- MySQL缓存优化技巧分享
- 392浏览 收藏
-
- 数据库 · MySQL | 1天前 |
- MySQL安装到D盘教程及路径设置详解
- 279浏览 收藏
-
- 数据库 · MySQL | 1天前 |
- MySQL缓存设置及查询作用解析
- 470浏览 收藏
-
- 数据库 · MySQL | 1天前 |
- MySQLcount优化技巧及性能提升方法
- 371浏览 收藏
-
- 数据库 · MySQL | 1天前 |
- MySQLUPDATE替换字段值方法详解
- 292浏览 收藏
-
- 数据库 · MySQL | 1天前 |
- MySQL基础:增删改查全教程
- 356浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 498次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 千音漫语
- 千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
- 95次使用
-
- MiniWork
- MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
- 89次使用
-
- NoCode
- NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
- 106次使用
-
- 达医智影
- 达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
- 98次使用
-
- 智慧芽Eureka
- 智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
- 97次使用
-
- golang MySQL实现对数据库表存储获取操作示例
- 2022-12-22 499浏览
-
- 搞一个自娱自乐的博客(二) 架构搭建
- 2023-02-16 244浏览
-
- B-Tree、B+Tree以及B-link Tree
- 2023-01-19 235浏览
-
- mysql面试题
- 2023-01-17 157浏览
-
- MySQL数据表简单查询
- 2023-01-10 101浏览