当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」

向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」

来源:51CTO.COM 2024-04-04 10:27:10 0浏览 收藏

偷偷努力,悄无声息地变强,然后惊艳所有人!哈哈,小伙伴们又来学习啦~今天我将给大家介绍《向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」》,这篇文章主要会讲到等等知识点,不知道大家对其都有多少了解,下面我们就一起来看一吧!当然,非常希望大家能多多评论,给出合理的建议,我们一起学习,一起进步!

「以史为鉴,可以知兴替。」人类的进步史是一个不断吸取过去经验、推进能力边界的自我演化过程。我们从过去的失败中吸取教训,纠正错误;借鉴成功经验,提升效率和效果。这种自我进化贯穿生活方方面面:总结经验解决工作问题,利用规律预测天气,我们持续从过去学习和进化。

成功从过去的经验中提取知识并将其应用于未来的挑战,这是人类进化之路上重要的里程碑。那么在人工智能时代,AI 智能体是否也可以做到同样的事情呢?

近年来,GPT和LLaMA等语言模型展示了在解决复杂任务时的惊人能力。然而,虽然它们可以利用工具解决具体任务,但本质上缺乏对过去成功和失败经历的洞见和汲取。这就像一个只能完成特定任务的机器人,虽然在当前任务中表现出色,但面对新的挑战时却无法调用过去的经验提供帮助。因此,我们需要进一步发展这些模型,使其能够积累知识和经验,并将其应用于新的情境中。通过引入记忆和学习机制,我们可以使这些模型具备更全面的智能,能够在不同任务和情境中灵活应对,并从过去的经验中获得启示。这将使得语言模型更加强大和可靠,并有助于推动人工智能的发展。

针对这一难题,近期来自清华大学、香港大学、人民大学以及面壁智能的联合团队提出了一种全新的智能体自我演化策略:探索 - 固化 - 利用(Investigate-Consolidate-Exploit,ICE)。它旨在通过跨任务的自我进化来提升 AI 智能体的适应性和灵活性。其不仅能提升智能体处理新任务时的效率和效果,还能显著降低对智能体基座模型能力的需求。

这个策略的出现,确实开启了智能体自我进化的新篇章,也标志着我们朝着实现完全自主的智能体又迈进了一步。

向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」

  • 论文标题:Investigate-Consolidate-Exploit: A General Strategy for Inter-Task Agent Self-Evolution
  • 论文链接:https://arxiv.org/abs/2401.13996

向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」智能体任务间经验迁移以实现自我进化概览图

智能体自我进化的两个方面:规划与执行

当前的复杂智能体主要可分为任务规划和任务执行两个方面。在任务规划方面,智能体通过逻辑推理将用户需求分解并制定详细的目标策略。而在任务执行方面,智能体利用各种工具与环境进行交互,以完成相应的子目标。

为了更好地促进以往经验的重复利用,作者在该论文中首先将进化策略解耦为两个方面。具体地,作者以XAgent智能体架构中的树状任务规划结构和ReACT链式工具执行为例,分别详细介绍了ICE策略的实现方法。

向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」智能体任务规划的 ICE 自我演化策略

对于任务规划,自我进化依照 ICE 被分为以下三个阶段:

  • 在探索阶段,智能体记录下整个树状任务规划结构,并同时动态检测各个子目标的执行状态;
  • 在固化阶段,智能体首先剔除所有失败的目标结点,之后对于每个成功完成的目标,智能体将以该目标为子树的所有叶子结点依次排开形成一条规划链(Workflow)
  • 在利用阶段,这些规划链将被作为新任务目标分解细化的参考依据,以利用过往的这些成功经验。

向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」智能体任务执行的 ICE 自我演化策略

任务执行的自我演化策略依然分为 ICE 三个阶段,其中:

  • 在探索阶段,智能体动态记录每个目标执行的工具调用链,并对工具调用中出现的可能问题进行简单的检测归类;
  • 在固化阶段,工具调用链将被转化为类似自动机的流水线(Pipeline)结构,工具调用顺序与调用之间的转移关系将被固定,同时还会去掉重复调用,增加分支逻辑等等让自动机自动化执行流程更加鲁棒;
  • 在利用阶段,对于相似的目标,智能体将直接自动化执行流水线,从而提升任务完成效率。

XAgent 框架下的自我进化实验

作者在 XAgent 框架中对提出的 ICE 自我演化策略进行了测试,并总结了以下四点发现:

  • ICE 策略能够显著降低模型的调用次数,从而提升效率,减少开销。
  • 存储的经验在 ICE 策略下有着较高的复用率,这证明了 ICE 的有效性。
  • ICE 策略能够提升子任务完成率同时减少规划返修的次数。
  • 通过以往经验的加持,任务执行对模型能力的要求显著下降。具体来看,使用 GPT-3.5 搭配上之前的任务规划与执行经验,效果可以直接媲美 GPT-4。

向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」在探索 - 固化进行经验存储后,测试集任务在不同智能体 ICE 策略下的表现

同时,作者还进行了额外的消融实验:在存储经验逐渐增加的情况下,智能体的表现是否越来越好?答案是肯定的。从零经验,半经验,到满经验,基座模型的调用次数逐渐减少,而子任务完成度逐渐提升,同时复用率也有升高。这表明更多的过往经验能够更好地促进智能体执行,实现规模效应。

向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」在不同经验存储量下,测试集任务表现的消融实验结果统计

结语

畅想一下,在人人都能够部署智能体的世界中,成功经验的数量会随着智能体个体任务执行不断累积,而用户也可以将这些经验在云端中、社区里进行分享。这些经验将促使智能体不断汲取能力,自我进化,逐渐达到完全自主。我们向这样的时代又迈进了一步。

以上就是《向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」》的详细内容,更多关于模型,数据的资料请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
基于Python的免费手机号码归属地查询基于Python的免费手机号码归属地查询
上一篇
基于Python的免费手机号码归属地查询
如何使用xpath解析html字符串
下一篇
如何使用xpath解析html字符串
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    26次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    21次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    23次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    23次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    25次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码