当前位置:首页 > 文章列表 > Golang > Go问答 > 关闭和发送到通道之间的竞争条件

关闭和发送到通道之间的竞争条件

来源:stackoverflow 2024-04-03 23:12:31 0浏览 收藏

今日不肯埋头,明日何以抬头!每日一句努力自己的话哈哈~哈喽,今天我将给大家带来一篇《关闭和发送到通道之间的竞争条件》,主要内容是讲解等等,感兴趣的朋友可以收藏或者有更好的建议在评论提出,我都会认真看的!大家一起进步,一起学习!

问题内容

我正在尝试使用工作池构建通用管道库。我为源、管道和接收器创建了一个接口。您会看到,管道的工作是从输入通道接收数据,对其进行处理,然后将结果输出到通道上。这是它的预期行为:

  1. 从输入通道接收数据。
  2. 将数据委托给可用的工作人员。
  3. worker 将结果发送到输出通道。
  4. 所有工作人员完成后关闭输出通道。
func (p *pipe) Process(in chan interface{}) (out chan interface{}) {
    var wg sync.WaitGroup
    out = make(chan interface{}, 100)
    go func() {
        for i := 1; i <= 100; i++ {
            go p.work(in, out, &wg)
        }
        wg.Wait()
        close(out)
    }()

    return
}

func (p *pipe) work(jobs <-chan interface{}, out chan<- interface{}, wg *sync.WaitGroup) {
    for j := range jobs {
        func(j Job) {
            defer wg.Done()
            wg.Add(1)

            res := doSomethingWith(j)

            out <- res
        }(j)
    }
}

但是,运行它可能会退出而不处理所有输入,或者因 send on closed channel 消息而出现恐慌。使用 -race 标志构建源会在 close(out)out <-res 之间发出数据争用警告。

这就是我认为可能发生的情况。一旦许多工人完成了工作,wg 的计数器就会瞬间归零。因此,wg.wait() 已完成,程序继续执行 close(out)。与此同时,作业通道尚未完成数据生成,这意味着一些工作人员仍在另一个 goroutine 中运行。由于 out 通道已经关闭,因此会导致恐慌。

等待组应该放在其他地方吗?或者有没有更好的方法来等待所有工人完成?


解决方案


目前尚不清楚为什么每个工作需要一名工作人员,但如果您这样做,您可以重组您的外循环设置(请参阅下面未经测试的代码)。这种方式从一开始就消除了对工作池的需求。

不过,在分拆任何工作人员之前,请务必执行 wg.add 。在这里,您正好剥离了 100 名员工:

var wg sync.waitgroup
out = make(chan interface{}, 100)
go func() {
    for i := 1; i <= 100; i++ {
        go p.work(in, out, &wg)
    }
    wg.wait()
    close(out)
}()

因此,您可以这样做:

var wg sync.waitgroup
out = make(chan interface{}, 100)
go func() {
    wg.add(100)  // added - count the 100 workers
    for i := 1; i <= 100; i++ {
        go p.work(in, out, &wg)
    }
    wg.wait()
    close(out)
}()

请注意,您现在可以将 wg 本身移动到派生工作线程的 goroutine 中。如果你放弃让每个工人将工作分拆为新的 goroutine 的想法,这可以让事情变得更干净。但是如果每个worker要派生另一个goroutine,那么该worker本身也必须使用wg.add,如下所示:

for j := range jobs {
    wg.add(1)  // added - count the spun-off goroutines
    func(j job) {
        res := dosomethingwith(j)

        out <- res
        wg.done()  // moved (for illustration only, can defer as before)
    }(j)
}
wg.done() // added - our work in `p.work` is now done

也就是说,每个匿名函数都是通道的另一个用户,因此在分离新的 goroutine 之前增加通道用户计数 (wg.add(1))。当您完成读取输入通道 jobs 后,调用 wg.done() (可能通过早期的 defer,但我在此处的末尾展示了它)。

思考这个问题的关键是 wg 计算此时可以写入通道的活动 goroutines 的数量。仅当没有 goroutine 打算再写入时,它才会变为零。这使得关闭通道变得安全。

考虑使用相当简单的(但未经测试):

func (p *pipe) process(in chan interface{}) (out chan interface{}) {
    out = make(chan interface{})
    var wg sync.waitgroup
    go func() {
        defer close(out)
        for j := range in {
            wg.add(1)
            go func(j job) {
                res := dosomethingwith(j)
                out <- res
                wg.done()
            }(j)
        }
        wg.wait()
    }()
    return out
}

现在,您有一个 goroutine 正在以最快的速度读取 in 通道,并在运行过程中分拆作业。每项传入的工作都会获得一个 goroutine,除非他们提前完成工作。没有池,每个作业只有一个工作人员(与您的代码相同,只是我们淘汰了不做任何有用事情的池)。

或者,由于只有一定数量的 cpu 可用,请像之前在开始时所做的那样分拆一定数量的 goroutine,但让每个 goroutine 运行一个 作业直至完成,并交付其结果,然后返回阅读下一篇作业:

func (p *pipe) process(in chan interface{}) (out chan interface{}) {
    out = make(chan interface{})
    go func() {
        defer close(out)
        var wg sync.waitgroup
        ncpu := runtime.numcpu()  // or something fancier if you like
        wg.add(ncpu)
        for i := 0; i < ncpu; i++ {
            go func() {
                defer wg.done()
                for j := range in {
                    out <- dosomethingwith(j)
                }
            }()
        }
        wg.wait()
    }
    return out
}

通过使用 runtime.numcpu(),我们只能获得与运行作业的 cpu 一样多的读取作业的工作线程。这些是池,它们一次只做一项工作。

如果输出通道读取器结构良好(即不会导致管道阻塞),通常不需要缓冲输出通道。如果不是,这里的缓冲深度会限制您可以在使用结果的人之前“先行完成”的作业数量。根据执行此“提前工作”的有用程度来设置它 - 不一定是 cpu 数量、预期作业数量或其他什么。

作业可能正在按如下方式完成:发送速度很快。在这种情况下,即使有更多的项目需要处理,waitgroup 也会在零附近浮动。

解决此问题的一个方法是在发送作业之前添加一个,并在发送所有作业后减少该作业,有效地将发送者视为“作业”之一。在这种情况下,最好在发送方中执行 wg.add

func (p *pipe) Process(in chan interface{}) (out chan interface{}) {
    var wg sync.WaitGroup
    out = make(chan interface{}, 100)
    go func() {
        for i := 1; i <= 100; i++ {
            wg.Add(1)
            go p.work(in, out, &wg)
        }
        wg.Wait()
        close(out)
    }()

    return
}

func (p *pipe) work(jobs <-chan interface{}, out chan<- interface{}, wg *sync.WaitGroup) {
    for j := range jobs {
        func(j Job) {
            res := doSomethingWith(j)

            out <- res
            wg.Done()
        }(j)
    }
}

我在代码中注意到的一件事是,每个作业都会启动一个 goroutine。同时,每个作业循环处理 jobs 通道,直到为空/关闭。似乎没有必要两者都做。

终于介绍完啦!小伙伴们,这篇关于《关闭和发送到通道之间的竞争条件》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布Golang相关知识,快来关注吧!

版本声明
本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
深度探讨:Go语言形参内存占用情况深度探讨:Go语言形参内存占用情况
上一篇
深度探讨:Go语言形参内存占用情况
深入理解Go语言的面向对象模型
下一篇
深入理解Go语言的面向对象模型
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    151次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    143次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    157次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    150次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    159次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码