当前位置:首页 > 文章列表 > Golang > Go问答 > 提取棋子和位置信息:棋盘游戏的分析方法

提取棋子和位置信息:棋盘游戏的分析方法

来源:stackoverflow 2024-02-05 21:33:54 0浏览 收藏

大家好,今天本人给大家带来文章《提取棋子和位置信息:棋盘游戏的分析方法》,文中内容主要涉及到,如果你对Golang方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!

问题内容

所以我正在使用 opencv(在 go 中使用 opencv)尝试从棋盘游戏中提取棋子。最初,我通过手动查找每个玩家棋子颜色和棋盘位置的 hsv 值来解决这个问题,并取得了一定的成功。我设法让这个工作正常进行,并以程序化的方式表示每件作品及其在棋盘上的位置。缺点是,如果使用不同的板,这需要非常认真的人机交互 - “找到”所有正确的 hsv 值。我在这里询问并得到了一个建议,首先忽略颜色,找到所有棋子,然后使用颜色聚类算法来找出哪个玩家。我可能还必须为这些职位做一些事情,但那是第二阶段。

所以现在我尝试提取所有碎片,无论颜色如何。

我开始尝试使用 newsimpleblobdetectorwithparams - 然而进展甚微,似乎在误报/误报方面遇到了很多困难。

我尝试了 houghcircleswithparams 但这似乎非常依赖于参数,而且我在检测到的实际片段方面没有取得太大进展。目前我正在使用 findcontours ,这似乎给了我一些合理的准确性。让我们看一下图片。

原始图像如下所示:

我已经构建了一个控件“仪表板”,似乎最“有用”的是侵蚀、膨胀和阈值。

我当前的设置是加载大量跟踪条/滑块来调整值,然后

            gocv.cvtcolor(clone, &clone, gocv.colorrgbtogray)
            erodekernel := gocv.getstructuringelement(gocv.morphrect, image.pt(trackers.erosionvalue, trackers.erosionvalue))
            gocv.erode(clone, &clone, erodekernel)
            dilatekernel := gocv.getstructuringelement(gocv.morphrect, image.pt(trackers.dilatevalue, trackers.dilatevalue))
            gocv.dilate(clone, &clone, dilatekernel)
            gocv.threshold(clone, &clone, float32(trackers.threstruncvalue), 255, gocv.thresholdtrunc)
            gocv.threshold(clone, &clone, float32(trackers.threshbinaryvalue), 255, gocv.thresholdbinary)
            cannies := gocv.newmat()
            gocv.canny(clone, &cannies, float32(trackers.cannymin), float32(trackers.cannymax))
            cnts := gocv.findcontours(cannies, gocv.retrievaltree, gocv.chainapproxsimple)

其次是

            for i := 0; i < cnts.size(); i++ {
                cnt := cnts.at(i)
                if len(cnt.topoints()) < 5 {
                    continue
                }
                rect := gocv.fitellipse(cnt)
                gocv.circle(&colorimage, image.pt(rect.center.x, rect.center.y), (rect.height + rect.width)/4, cntcolor, 3)

                if gocv.contourarea(cnt) < gocv.arclength(cnt, false) {
                    continue
                }
                gocv.rectangle(&colorimage, rect.boundingrect, rectcolor, 2)
                psvector := gocv.newpointsvector()
                psvector.append(cnt)
                gocv.drawcontours(&clone, psvector, 0, rectcolor, 3)
                if rect.center.x == (rect.boundingrect.max.x + rect.boundingrect.min.x) / 2 && rect.center.y == (rect.boundingrect.min.y + rect.boundingrect.max.y) / 2 {
                    //does the circle fit inside the square?
                    if float64(rect.width * rect.height) > math.pi * math.pow(float64((rect.height+rect.width)/4), 2) {
                        gocv.circle(&colorimage, image.pt(rect.center.x, rect.center.y), 2, matchcolor, 3)
                        pieces = append(pieces, image.pt(rect.center.x, rect.center.y))
                    }
                }
            }

这个想法是,如果轮廓有 5 个点,那么你可以找到边界矩形,然后如果轮廓是闭合的,则在轮廓的中心画一个圆,如果它适合边界矩形,则它们共享同一个中心,可能是一个棋子。注意 - 我根据观察圆圈和边界矩形的位置以及它们何时匹配而得出了这一原则,这似乎是一个游戏块。

所以我取得了一些不错的进步。然而,我的问题有助于挖掘其他颜色块的方法,也许更“稳健”地挖出白色块。我觉得我没有足够的工具可供使用,就好像我增加一项就必须减少另一项一样,出于某种原因,我觉得在棋盘上找到 30 轮跳棋应该相当稳健。 当我调整寻找栗色碎片的值时,我可以得到其中一些

但是正如您所看到的,使用阈值/侵蚀/扩张时的差异并不能很好地找到它们。

编辑:

我重新添加了霍夫圆算法,以表明它会出现很多误报 - 在本例中它得到了 1。

            gocv.HoughCirclesWithParams(
                clone,
                &circles,
                gocv.HoughGradient,
                1,                     // dp
                15, // minDist
                75,                    // param1
                20,                    // param2
                20,                    // minRadius
                45,                     // maxRadius
            )
            blue := color.RGBA{0, 0, 255, 0}
            for i := 0; i < circles.Cols(); i++ {
                v := circles.GetVecfAt(0, i)
                // if circles are found
                if len(v) > 2 {
                    x := int(v[0])
                    y := int(v[1])
                    r := int(v[2])
                    gocv.Circle(&colorImage, image.Pt(x, y), r, blue, 2)
                }
            }

这是我使用的阈值。

所以我意识到我在这里说了很多。我正在寻找一些帮助来检测棋盘上的所有棋子。 我正在使用 gocv 执行此操作,但如果有人有好的参考资料或其他内容,我可以使用 python/convert python 代码。

这里是没有任何修改的原始图像。正如我所说,我的目标是自动检测棋盘上的 30 个棋子,然后我可以使用聚类算法来计算出它们属于哪个组(我认为......)我想用最少的人机交互来做到这一点拖动滑块,因为这不是一种有趣/良好的用户体验......

我的想法

  • 用户可以拖动组周围的边界框,这样计算机就可以更轻松地工作,因为它知道必须在其中找到碎片。
  • 用户可以选择页面的颜色,这会告诉计算机应该查找的 hsv 值大致是多少
  • 用户可以根据已知的棋子起始位置进行校准,以便计算机知道要查看的位置。

正确答案


不完全是您问题的答案,但如果您使用对象检测来代替,这会容易得多。同样,在我的教程中我找到了不同的对象。在这种情况下,我将有 2 个或可能 3 个类:浅色块、深色块,可能还有另一个类用于空白空间。

我通常使用 OpenCV 和 Darknet/YOLO 来解决这类事情。我的 YouTube 频道上有很多教程。这是一个检测一些形状的简单方法:https://www.youtube.com/watch?v=yOJIRArZeig 这是另一个显示用于解决数独问题的 OpenCV 和 Darknet/YOLO 的方法:https://www.youtube.com/watch?v=BUG7HlhuArw

您的情况与上一个类似。您将返回检测到的对象的向量,以及图像或视频帧内每个对象的边界框坐标。如果有兴趣,这是我建议开始的教程视频:https://www.youtube.com/watch?v=pJ2iyf_E9PM

到这里,我们也就讲完了《提取棋子和位置信息:棋盘游戏的分析方法》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

版本声明
本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
读取 os.stdout读取 os.stdout
上一篇
读取 os.stdout
并发单次写入操作下的单写多读
下一篇
并发单次写入操作下的单写多读
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    125次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    122次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    136次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    131次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    132次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码