丢失记录之谜:在 Go 中调试 JSON 到 CSV 的转换
哈喽!大家好,很高兴又见面了,我是golang学习网的一名作者,今天由我给大家带来一篇《丢失记录之谜:在 Go 中调试 JSON 到 CSV 的转换》,本文主要会讲到等等知识点,希望大家一起学习进步,也欢迎大家关注、点赞、收藏、转发! 下面就一起来看看吧!
在我的一个业余项目中构建数据转换实用程序期间,我需要将 json 格式的文件转换为 csv 格式。我遇到了一个棘手的问题,花了近一个小时进行调试才确定根本原因。
这个过程应该很简单,包括三个主要步骤:
- 打开 json 文件
- 将该 json 文件解析为特定的结构
- 将数据写入 csv 文件 首先,让您了解一下,json 是一个包含 65,342 个元素的数组。
func jsontocsv(data *srcsheet) { // create file name in a format like "email_241030172647.csv" (email_yymmddhhmmss.csv) fname := filename() // create file f, err := os.create(fname) if err != nil { log.println("unable to create file", err) return } defer f.close() // closing to release resources w := csv.newwriter(f) // initializing csv writer // add header header := []string{"email", "provider", "added_on"} if err = w.write(header); err != nil { log.println("unable to write header", err) return } count := 0 for domain, elm := range data.email { if err := w.write(newrecord(domain, elm)); err != nil { log.println("unable to add new record", domain, err) return } else { count++ } } log.println("number of records written =", count) } func newrecord(email string, e *srcelements) []string { if e == nil { return nil } dbformat := "2006-01-02 15:04:05.000" addedon := time.now().utc().format(dbformat) r := []string{email, e.provider, addedon} return r }
代码很简单:创建一个具有特定名称格式的新文件,推迟其关闭,初始化 csv 编写器,然后开始写入该文件。超级简单吧?
步骤 1 和 2 效果很好,所以省略了。让我们将焦点转移到步骤 3,其中发生了意外的情况:csv 输出仅包含 65,032 条记录,这意味着缺少 310 条记录。
为了排除故障,我尝试了仅使用 7 个 json 元素(而不是 65,032 个)的代码。令人惊讶的是,csv 文件中根本没有写入任何内容!
我仔细检查了一些简单的错误,比如缺少文件关闭,但一切看起来都很好。然后我重试了完整的 65,032 个元素,希望能获得更多线索。这时我发现不仅少了310条记录,而且最后一条记录也不完整。
65030 adam@gmail.com, gmail, 2023-03-17 15:04:05.000 65031 jac@hotmail.com, hotmail, 2023-03-17 15:04:05.000 65032 nancy@xyz.com, hotmail, 2023-03-
这是进步——我现在可以缩小问题范围并专注于 w.write(newrecord(domain, elm)),特别是 w.write(...) 方法。我查了文档,找到了原因:
...写入会被缓冲,因此最终必须调用 [writer.flush] 以确保记录写入底层 io.writer ...
我忘记调用 w.flush()。这是有道理的,因为从性能角度来看,csv 编写器会缓冲写入,而不是每次调用 w.write() 时执行 i/o 操作。通过缓冲数据,它减少了 i/o 负载,并在最后调用 w.flush() 确保缓冲区中的任何剩余数据都写入文件。
这是更正后的代码:
... f, err := os.Create(fName) if err != nil { log.Println("Unable to create file", err) return } defer f.Close() w := csv.NewWriter(f) defer w.Flush() // Add header header := []string{"email", "provider", "added_on"} ...
为了确认,我检查了 bufio.go 源代码,发现默认缓冲区大小为 4k。在 writerune(...) 方法中,您将看到每当缓冲区达到其限制时它就会调用 flush。
就这些了!我希望你喜欢阅读。我倾向于从错误中学到很多东西——无论是我的还是别人的。即使没有立即解决办法,发现错误的方法也可以帮助我避免将来陷入类似的陷阱。这就是为什么我想分享这个经验!
到这里,我们也就讲完了《丢失记录之谜:在 Go 中调试 JSON 到 CSV 的转换》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

- 上一篇
- 分片上传中后端为什么使用“blob”作为文件名?

- 下一篇
- win10怎么设置平板模式下自动隐藏任务栏
-
- Golang · Go教程 | 3分钟前 |
- C++多线程转Go:性能与实践全解析
- 226浏览 收藏
-
- Golang · Go教程 | 4分钟前 |
- Golang反射性能优化技巧分享
- 475浏览 收藏
-
- Golang · Go教程 | 5分钟前 |
- Golang享元模式优化,sync.Pool复用详解
- 319浏览 收藏
-
- Golang · Go教程 | 6分钟前 | 目录结构 Golang项目
- Golang项目结构设计与代码解耦技巧
- 131浏览 收藏
-
- Golang · Go教程 | 7分钟前 |
- Golang数据库优化:预处理与连接池配置详解
- 489浏览 收藏
-
- Golang · Go教程 | 18分钟前 |
- Go中接口包定义技巧分享
- 431浏览 收藏
-
- Golang · Go教程 | 21分钟前 |
- Golang反射获取结构体字段全解析
- 261浏览 收藏
-
- Golang · Go教程 | 29分钟前 |
- Go语言任意长度序列作为Map键方法
- 376浏览 收藏
-
- Golang · Go教程 | 34分钟前 | golang JPEG
- GolangJPEG编码解码教程详解
- 240浏览 收藏
-
- Golang · Go教程 | 36分钟前 |
- Golang测试工具推荐与配置方法
- 474浏览 收藏
-
- Golang · Go教程 | 38分钟前 |
- Golangmap初始化技巧全解析
- 186浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 499次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 千音漫语
- 千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
- 713次使用
-
- MiniWork
- MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
- 673次使用
-
- NoCode
- NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
- 703次使用
-
- 达医智影
- 达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
- 720次使用
-
- 智慧芽Eureka
- 智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
- 695次使用
-
- Golangmap实践及实现原理解析
- 2022-12-28 505浏览
-
- 试了下Golang实现try catch的方法
- 2022-12-27 502浏览
-
- Go语言中Slice常见陷阱与避免方法详解
- 2023-02-25 501浏览
-
- Golang中for循环遍历避坑指南
- 2023-05-12 501浏览
-
- Go语言中的RPC框架原理与应用
- 2023-06-01 501浏览