避免重复输出的 Go 并发工作池
今天golang学习网给大家带来了《避免重复输出的 Go 并发工作池》,其中涉及到的知识点包括等等,无论你是小白还是老手,都适合看一看哦~有好的建议也欢迎大家在评论留言,若是看完有所收获,也希望大家能多多点赞支持呀!一起加油学习~
我正在编写一个程序,该程序同时从文本文件中逐字读取,以使用通道和工作池模式计算出现次数
该程序按以下流程工作:
- 读取文本文件(
readtext
函数) readtext
函数将每个单词发送到word
通道- 每个 goroutine 都会执行
countword
函数来计算地图中的单词数量 - 每个goroutine返回一个map,worker函数将struct的result值传递给
resultc
通道 - 测试函数根据来自
resultc
通道的结果值创建地图 - 打印第 5 步创建的地图
程序可以运行,但是当我尝试输入 fmt.println(0)
来查看如下所示的过程时
func computetotal() { i := 0 for e := range resultc { total[e.word] += e.count i += 1 fmt.println(i) } }
程序终止而不显示/计算所有单词
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 all goroutines finished 16 17 18 map[but:1 cat's:1 crouched:1 fur:1 he:2 imperturbable:1 it:1 pointed:1 sat:1 snow:1 stiffly:1 the:1 was:2 with:1] total words: 27 38 ... 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 time taken for reading the book 5.8145ms
如果我在此处取消计算 total 函数语句中的 fmt.println() 注释,程序会正确显示结果,输出如下所示
all goroutines finished map[a:83 about:4 above:2 absolute:1 accepted:1 across:1 affection:1 after:1 again:5 wonder:2 wood:5 wooded:1 woody:1 work:1 worked:2 world:4 would:11 wrapped:1 wrong:1 yellow:2 yielded:1 yielding:1 counts continues ......] total words: 856 time taken for reading the book 5.9924ms
这是我的 readtext 实现
//ensure close words at the right timing func readtext() { file, err := os.open(filename) if err != nil { log.fatal(err) } defer file.close() scanner := bufio.newscanner(file) scanner.split(bufio.scanwords) for scanner.scan() { word := strings.tolower(scanner.text()) words <- strings.trim(word, ".,:;") } //time.sleep(1 * time.second) close(words) }
这是我使用工作池实现的字数统计
//call countword func, func workerpool() { var wg sync.waitgroup for i := 1; i <= numofworker; i++ { wg.add(1) go worker(&wg) } wg.wait() fmt.println("all goroutines finished") close(resultc) } func worker(wg *sync.waitgroup) { var tempmap = make(map[string]int) for w := range words { resultc <- countword(w, tempmap) //retuns result value } wg.done() } //creates a map each word func countword(word string, tempmap map[string]int) result { _, ok := tempmap[word] if ok { tempmap[word]++ return result{word, tempmap[word] + 1} } return result{word, 1} }
最后,这是主函数
const FILENAME = "cat.txt" const BUFFERSIZE = 3000 const NUMOFWORKER = 5 var words = make(chan string, BUFFERSIZE) //job var resultC = make(chan Result, BUFFERSIZE) var total = map[string]int{} type Result struct { word string count int } func main() { startTime := time.Now() go readText() go computeTotal() workerPool() //blocking fmt.Println(total) endTime := time.Now() timeTaken := endTime.Sub(startTime) fmt.Println("total words: ", len(total)) fmt.Println("Time taken for reading the book", timeTaken) }
我一直在寻找为什么该程序没有显示一致的结果,但我还无法弄清楚。我如何更改程序才能产生相同的结果?
正确答案
您必须按以下方式重写 computetotal
函数:
func computetotal(done chan struct{}) { defer close(done) i := 0 for e := range resultc { total[e.word] += e.count i += 1 fmt.println(i) } } func main() { computetotaldone := make(chan struct{}) go computetotal(computetotaldone) ... workerpool() //blocking <-computetotaldone fmt.println(total) }
添加 fmt.println
导致无效结果的原因是您的实现存在竞争条件。由于主函数 fmt.println(total)
和 computetotal
函数中的打印总计结果并行运行,因此不能保证 computetotal
在调用 fmt.println(total)
之前处理所有消息。如果没有 fmt.println
,computetotal
函数在您的计算机上足够快以产生正确的结果。
建议的解决方案确保 computetotal
在调用 fmt.println(total)
之前完成。
countword
函数始终返回 count == 1 的结果。
这是增加计数的函数版本:
func countword(word string, tempmap map[string]int) result { count := tempmap[word] + 1 tempmap[word] = count return result{word, count} }
但是保持这个想法! comcomputitatal
假设cbcountzqbentzqbendcbendczqb的结果始终发送
result中的工人始终发送
result {word,1} ult {word,1}
直接来自 readtext
。代码如下:
func computetotal() { i := 0 for e := range resultc { total[e.word] += e.count i += 1 fmt.println(i) } } func readtext() { file, err := os.open(filename) if err != nil { log.fatal(err) } defer file.close() scanner := bufio.newscanner(file) scanner.split(bufio.scanwords) for scanner.scan() { word := strings.tolower(scanner.text()) resultc <- result{strings.trim(word, ".,:;"), 1} } close(resultc) } main() { ... go readtext() computetotal() fmt.println(total) ... }
通道操作的开销可能会抵消在单独的 goroutine 中运行 computetotal
和 readtext
的任何好处。下面是组合成单个 goroutine 的代码:
func main() { file, err := os.open(filename) if err != nil { log.fatal(err) } defer file.close() scanner := bufio.newscanner(file) scanner.split(bufio.scanwords) var total = map[string]int{} for scanner.scan() { word := strings.tolower(strings.trim(scanner.text(), ".,:;")) total[word]++ } fmt.println(total) }
问题中的 countword
函数让我认为您的目标是计算每个工作人员中的单词数并将结果合并为总数。这是代码:
func computeTotal() { for i := 1; i <= NUMOFWORKER; i++ { m := <-resultC for word, count := range m { total[word] += count } } } func workerPool() { for i := 1; i <= NUMOFWORKER; i++ { go worker() } } func worker() { var tempMap = make(map[string]int) for w := range words { tempMap[w]++ } resultC <- tempMap } ... var resultC = make(chan map[string]int) ... func main() { ... go readText() workerPool() computeTotal() ... }
今天关于《避免重复输出的 Go 并发工作池》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

- 上一篇
- 在 Go 语言中定义全局常量映射

- 下一篇
- 使用Sarama库为Kafka消费者自定义消息反序列化器
-
- Golang · Go问答 | 1年前 |
- 在读取缓冲通道中的内容之前退出
- 139浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 戈兰岛的全球 GOPRIVATE 设置
- 204浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何将结构作为参数传递给 xml-rpc
- 325浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何用golang获得小数点以下两位长度?
- 478浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何通过 client-go 和 golang 检索 Kubernetes 指标
- 486浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 将多个“参数”映射到单个可变参数的习惯用法
- 439浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 将 HTTP 响应正文写入文件后出现 EOF 错误
- 357浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 结构中映射的匿名列表的“复合文字中缺少类型”
- 352浏览 收藏
-
- Golang · Go问答 | 1年前 |
- NATS Jetstream 的性能
- 101浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何将复杂的字符串输入转换为mapstring?
- 440浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 相当于GoLang中Java将Object作为方法参数传递
- 212浏览 收藏
-
- Golang · Go问答 | 1年前 |
- 如何确保所有 goroutine 在没有 time.Sleep 的情况下终止?
- 143浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 498次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 千音漫语
- 千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
- 82次使用
-
- MiniWork
- MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
- 73次使用
-
- NoCode
- NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
- 83次使用
-
- 达医智影
- 达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
- 81次使用
-
- 智慧芽Eureka
- 智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
- 79次使用
-
- GoLand调式动态执行代码
- 2023-01-13 502浏览
-
- 用Nginx反向代理部署go写的网站。
- 2023-01-17 502浏览
-
- Golang取得代码运行时间的问题
- 2023-02-24 501浏览
-
- 请问 go 代码如何实现在代码改动后不需要Ctrl+c,然后重新 go run *.go 文件?
- 2023-01-08 501浏览
-
- 如何从同一个 io.Reader 读取多次
- 2023-04-11 501浏览