当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

来源:51CTO.COM 2023-10-14 10:41:14 0浏览 收藏

“纵有疾风来,人生不言弃”,这句话送给正在学习科技周边的朋友们,也希望在阅读本文《MotionLM:多智能体运动预测的语言建模技术》后,能够真的帮助到大家。我也会在后续的文章中,陆续更新科技周边相关的技术文章,有好的建议欢迎大家在评论留言,非常感谢!

本文经自动驾驶之心公众号授权转载,转载请联系出处。

原标题:MotionLM: Multi-Agent Motion Forecasting as Language Modeling

论文链接:https://arxiv.org/pdf/2309.16534.pdf

作者单位:Waymo

会议:ICCV 2023

MotionLM:多智能体运动预测的语言建模技术

论文思路:

对于自动驾驶车辆安全规划来说,可靠地预测道路代理未来行为是至关重要的。本研究将连续轨迹表示为离散运动令牌序列,并将多智能体运动预测视为语言建模任务。我们提出的模型MotionLM具有以下几个优点:首先,它不需要使用锚点或显式潜变量来优化学习多模态分布。相反,我们利用标准的语言建模目标,最大化序列令牌的平均对数概率。其次,我们的方法避免了事后交互启发法,其中个体代理轨迹生成是在交互评分之后进行的。相反,MotionLM在单个自回归解码过程中生成了交互式代理未来的联合分布。此外,模型的顺序分解可以实现时间上的因果条件推断。我们提出的方法在Waymo Open Motion Dataset上取得了新的最先进性能,排名第一于交互式挑战排行榜

主要贡献:

在这篇文章中,我们将多智能体运动预测作为一项语言建模任务进行讨论。我们引入了时间因果解码器,对经过因果语言建模损失训练的离散运动令牌进行解码

本文将结合模型中的采样和简单的 rollout 聚合方案,以提高联合轨迹的加权模式识别能力。我们通过在 Waymo Open Motion Dataset 交互预测挑战中的实验,证明了这一新的方法在排名联合 mAP 指标上提高了6%,达到了最先进的性能水平

本文对本文的方法进行了广泛的消融实验,并对它的时间因果条件预测进行了分析,这在很大程度上是目前的联合预测模型所不支持的。

网络设计:

本文的目标是以一种通用的方式对多智能体交互上的分布建模,这种分布可以应用于不同的下游任务,包括最低限度的、联合的和条件预测。为了实现这一目标,需要一个有表现力的生成框架,能够捕捉到驾驶场景中的多种形态。此外,本文在这里考虑保存时间依赖性;即,在本文的模型中,推理遵循一个有向无环图,每个节点的父节点在时间上较早,子节点在时间上较晚,这使得条件预测更接近于因果干预,因为它消除了某些虚假的相关性,否则就会导致不服从时间因果关系。本文观察到,不保留时间依赖关系的联合模型可能在预测实际agent反应方面的能力有限,这是规划中的一个关键用途。为此,本文利用了未来解码器的自回归分解,其中代理的运动tokens有条件地依赖于所有先前采样的tokens,并且轨迹按顺序推出

MotionLM:多智能体运动预测的语言建模技术

图1。本文的模型自回归地为一组代理生成离散运动tokens序列,以产生一致的交互式轨迹预测。

MotionLM:多智能体运动预测的语言建模技术

请看图2,这是MotionLM的架构

本文首先将与每个建模代理相关的异构场景特征(左)编码为形状R、N、·、H的场景嵌入。其中,R为首次推出(rollouts)的数量,N为联合建模的代理数量,H为每次嵌入的维数。在推理过程中,为了并行采样,本文在批量维度上重复嵌入R次。接下来,一个轨迹解码器以一种时间因果的方式(中心)为多个代理推出(rolls out) T 个离散运动tokens。最后,通过使用非最大抑制初始化的k-means聚类的简单聚合,可以恢复 rollouts 典型模式(右图)。

MotionLM:多智能体运动预测的语言建模技术

图3。展示了三个WOMD场景的前两种预测联合推出(joint rollout)模式。

颜色梯度表示了从t = 0秒到t = 8秒的时间变化。联合模式由绿色过渡到蓝色,次联合模式由橙色过渡到紫色的概率最大。我们观察到了三种类型的交互:相邻车道中的智能体会根据变道时间给予变道智能体让行(左侧),行人会根据车辆的进度走在过往车辆后面(中间),转弯车辆要么会给过路的骑车人让路(最可能的模式),要么会在骑车人接近之前转弯(次要模式)(右侧)

MotionLM:多智能体运动预测的语言建模技术

请看图4。这张图展示了联合推出(左侧)、干预后因果贝叶斯网络(中间)和因果条件反射(右侧)的因果贝叶斯网络表示

实线表示时间上的因果相关性,而虚线表示因果信息流。没有时间依赖约束的模型将支持因果条件作用,但不支持时间因果条件作用,这在试图预测agent反应时可能是有问题的。

实验结果:

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

引用:

Seff, A., Cera, B., Chen, D., Ng, M., Zhou, A., Nayakanti, N., Refaat, K. S., & Sapp, B. (2023). MotionLM: Multi-Agent Motion Forecasting as Language Modeling. ArXiv. /abs/2309.16534

MotionLM:多智能体运动预测的语言建模技术

原文链接:https://mp.weixin.qq.com/s/MTai0rA8PeNFuj7UjCfd6A

终于介绍完啦!小伙伴们,这篇关于《MotionLM:多智能体运动预测的语言建模技术》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
科技昨夜今晨 1013:欧菲光回应为华为 Mate60 提供摄像头模组:“倔强地活着”;荣耀 Magic Vs2 折叠屏手机发布,6999 元起;威马车主反映车机及 App 已停服科技昨夜今晨 1013:欧菲光回应为华为 Mate60 提供摄像头模组:“倔强地活着”;荣耀 Magic Vs2 折叠屏手机发布,6999 元起;威马车主反映车机及 App 已停服
上一篇
科技昨夜今晨 1013:欧菲光回应为华为 Mate60 提供摄像头模组:“倔强地活着”;荣耀 Magic Vs2 折叠屏手机发布,6999 元起;威马车主反映车机及 App 已停服
国内人工智能领域迎来大规模新品发布,众多“大国重器”集中展示
下一篇
国内人工智能领域迎来大规模新品发布,众多“大国重器”集中展示
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    1097次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    1053次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    990次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    1180次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    1166次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码