机器视觉和深度学习如何改善物流和仓储运营?
一分耕耘,一分收获!既然打开了这篇文章《机器视觉和深度学习如何改善物流和仓储运营?》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!
根据2021年Pitney Bowes包裹运输指数,全球2020年运送了1310亿个包裹。到2026年,这一数字预计将增加一倍以上,这一数字将因全球疫情和不断增长的电子商务行业而加速。随着在线零售购买量的增加,物流、仓库和运输流程的自动化需求已成为当务之急。
包装测量、质量检测、条形码读取、光学字符识别/光学字符验证 (OCR/OCV)和物料搬运优化(目前许多企业都手动执行)是运输行业价值链中实现自动化的关键阶段。
"物流、仓储和运输企业正努力加快运营速度。但加快速度意味着准确性和准确性是必不可少的,因为没有时间处理错误。此外还有人员配备问题。" Zebra Technologies 供应链解决方案总监 Mark Wheeler 说,"当你把这三件事放在一起时,你得到的是一个非常开放的市场,通过以创新的方式结合现有技术和新技术来尝试新事物。"这些创新大多以机器视觉为中心。
视觉引导机器人
在仓库或配送中心,托盘货物通常标志着仓储过程的开始和结束。在进入设施后,托盘货物要么被拆成单独的箱子,要么作为完整的托盘储存。拆垛应用已经从主要使用人工过渡到依靠视觉引导的机器人。当机器人在传送带上放置前一个货物时,机器视觉通过定位下一个要拣选的包裹来加速这一过程。
"大多数包裹都是以托盘装载的形式到达和离开仓库的,"易福门公司机器人感知业务发展部的Garrett Place说,"它们在现代仓库中的旅程是大多数机器视觉在物流中应用的核心。
康耐视公司物流视觉产品高级经理Ben Carey对此表示赞同,机器视觉在物流中的应用涵盖四个领域:测量、检查、引导和识别。这些领域中的每一个都存在于从进货接收过程到分拣一直到出货检查点的过程中。
向机器视觉解决方案开发人员询问将可重复性带入用例的最佳方法,他们可能会说一些关于限制变量数量的事情。毕竟,变量会创建边缘的应用。但是,大多数仓储和物流操作所移动的包裹可能是任何颜色、大小、形状和材料。这种程度的可变性使得技术选择以及解决方案的创建变得极为困难。
"过去几年亚马逊举办的机器人分拣挑战赛就是一个很好的例子,"Place说,"这也是物流中大多数机器视觉用例是多摄像机和多模式的主要原因。一台相机和一项技术不足以管理这些类型应用中的可变性。"
Zivid公司产品营销经理John Leonard对此表示赞同,"主要的应用包括进出设施的箱子的卸垛和码垛。在这些进出操作之间,主要是单件拣选操作和订单拣选以完成订单。这些都是使用不同的方法完成的,具体方法因地而异。"
这些方法包括由车载3D视觉引导的自主移动机器人(AMR)。例如,AMR可以自主地走到仓壁上寻找和选择物品。机器人也可以挑选由传送带送来的物品。其他移动机器人可以将物品运到视觉站,以便检查货物的类型和数量。
Zebra公司推出的 FlexShelf Guide为料仓尺寸和间距提供了灵活的配置,扩展了可使用 AMR 拣选的物品类型。
对于全托盘装载存储,许多仓库部署自动导引车(AGV)来拣选和存储托盘以进行检索。在行驶过程中,AGV依靠机器视觉进行托盘姿势和障碍物检测。机器视觉代码读取在整个过程中跟踪托盘和箱子负载。
当满载的托盘准备离开设施时,AGV负责管理移动,而机械臂将箱子转换为满载托盘。然后,这些即装即用的托盘在进入卡车之前进行称重和测量,使托盘尺寸成为物流中机器视觉的另一个强大用例。
"该行业已经发生了转变,从严格按重量评估运费转向按体积重量收费,这使得精确的尺寸测量比以往任何时候都更加重要。"LMI Technologies公司美洲区域发展经理Daniel Howe说,"智能3D传感器是包装和物流过程自动化的关键驱动因素,包括体积尺寸、分拣和表面缺陷等检测。"
许多AMR和AGV采用易福门的O3R平台进行机器人感知。它由紧凑型摄像头(VGA摄像头和飞行时间传感器)和带有NVIDIA Jetson TX2的视觉处理单元(VPU)组成,用于评估数据。最多可以将6个摄像头连接到基于Linux的设备,包括来自其他公司的传感器。
对提高速度和吞吐量的高需求
虽然物流和仓储应用面临许多挑战,但对更高速度和更高吞吐量的需求是不变的。挑战包括用透明聚脂袋包装的物品,由于其反射光线的方式,给成像带来挑战。其他拣件操作可能需要颜色作为物品检测过程的一部分,这可能需要支持图像中颜色信息的3D视觉。
根据Leonard的说法,校准是所有3D相机的一大挑战,因为它们被设计为在千分尺范围内工作,工业环境中常见的敲击、温度波动和振动很容易影响校准,从而影响3D相机的精度。
一些相机,如Zivid 3D相机,是专门为在工业环境中运行而设计和制造的,额定等级为IP65,并具有自动校准功能。这意味着,如果由于大型卷帘门的打开和关闭而使温度变化了5度(这在物流仓库中很常见),然后相机会进行调整以保持完美校准。
LMI公司开发了超宽视场Gocator 2490传感器,该传感器专门设计用于为运输提供快速准确的包裹尺寸测量。箱子可以在输送机上以2 m/s的速度移动。根据Howe的说法,一个单宽视场Gocator 2490智能传感器可以以800 Hz的速率扫描和测量整个盒子尺寸(宽x高x深),扫描区域为1 m x 1 m,在所有三个维度(x、Y、Z)中提供2.5 mm的分辨率。
足够高的分辨率,使Gocator 2490不仅可以测量各种包裹大小的尺寸,甚至可以检测包装中的细微缺陷。这种在线检查功能允许在检测到有缺陷的包裹时触发通过/失败决定。
Gocator 2490还为解决更高级的包装应用(如空隙填充)提供了机会,这涉及扫描带有物品的开放包装,并确定需要多少包装材料来填充空白空间。对于此类应用,双摄像头配置有助于避免盒子或手提袋内的遮挡。
边缘深度学习
随着物流领域的复杂性成倍增加,机器视觉的应用也面临着更多挑战。例如,试图检测高速传送带上随机方向的不同类型的物体,传统的基于规则的机器视觉检测在这些情况下会遇到困难。
然而,嵌入式平台中易于使用的机器学习和深度学习正在出现,以解决以前具有挑战性的应用。例如,康耐视最近推出的In-Sight 2800具有边缘学习功能,易于设置,不需要编程。它能对从箱子到手提箱再到塑料袋的所有东西进行快速而准确的分类,并完全在智能相机上运行。
"In-Sight 2800上的边缘学习等技术提高了包装检测率,从而减少了人工返工,并通过更先进的材料处理自动化实现更好的订单准确性,"Carey说,"我们的客户受益于处理速度的提高和更少的人工互动,使这些公司能够在不改变人员数量的情况下管理波动的需求,这在当今劳动力紧张的环境中仍然是一个挑战。"
机器视觉的民主化
例如,现代仓库中部署的大多数技术,包括2D和3D相机以及增强的计算能力,都是以前已知方法的迭代。有点新的是在多摄像头、多模式战略中利用所有这些技术,并结合ML的大型处理能力来管理应用。
"过去我们常常在仓库中看到单一供应商的解决方案,"Place解释道,"现在,我们会看到多个供应商和技术的组合,每个供应商和技术都有自己的优势,共同部署以解决挑战。这种方法将继续解锁以前未被机器视觉触及的用例。可以把它想象成在仓储和物流中机器视觉的民主化。"
很难将焦点指向一项技术的进步。当然,工业相机正在提供更好、更可重复的数据,计算速度更快,但没有什么能改变游戏规则。最大的进步在于组件在解决仓库问题的多技术方法中的易用性。
"物流正朝着机器人技术的方向发展,"Place总结道,"机器人是一个集成问题。机器视觉及其复杂性正在从单一相机的焦点转向减少现代仓库所需的所有组件集成摩擦的焦点。这种方法将把我们带到这个旅程的下一步。"
本篇关于《机器视觉和深度学习如何改善物流和仓储运营?》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于科技周边的相关知识,请关注golang学习网公众号!

- 上一篇
- 2022年人工智能在医疗领域的十大应用场景

- 下一篇
- ChatGPT 加持,决策大模型距离 AGI 更进一步
-
- 舒服的荔枝
- 太详细了,已收藏,感谢老哥的这篇技术贴,我会继续支持!
- 2023-06-07 12:31:45
-
- ouba
- 太给力了,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢大佬分享文章!
- 2023-05-29 18:12:24
-
- 甜美的老师
- 这篇文章出现的刚刚好,很详细,感谢大佬分享,码住,关注博主了!希望博主能多写科技周边相关的文章。
- 2023-05-12 17:46:28
-
- 科技周边 · 人工智能 | 30分钟前 | 字节跳动 数据中心
- 字节跳动计划在巴西建数据中心
- 345浏览 收藏
-
- 科技周边 · 人工智能 | 43分钟前 |
- UFO²—微软新推Windows桌面Agent
- 372浏览 收藏
-
- 科技周边 · 人工智能 | 48分钟前 |
- Pad.ws—AI开发神器,白板与代码编辑器完美融合
- 328浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 3月纯电动车销量:ModelY夺冠,小米SU7第五
- 125浏览 收藏
-
- 科技周边 · 人工智能 | 5小时前 |
- 即梦ai社交媒体导出教程及平台格式适配
- 282浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 15次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 15次使用
-
- 可图AI图片生成
- 探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
- 43次使用
-
- MeowTalk喵说
- MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
- 43次使用
-
- Traini
- SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
- 38次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览