当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述

AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述

来源:51CTO.COM 2023-08-31 21:47:16 0浏览 收藏

你在学习科技周边相关的知识吗?本文《AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述》,主要介绍的内容就涉及到,如果你想提升自己的开发能力,就不要错过这篇文章,大家要知道编程理论基础和实战操作都是不可或缺的哦!

在当前的AI时代,自主智能体被认为是通向通用人工智能(AGI)的一条有前途的途径。自主智能体指的是能够通过自主规划和指令来完成任务的实体。在早期的开发模式中,智能体的行动策略主要基于启发式,并在与环境的交互中逐步改进

然而,在无限制的开放环境中,自主智能体的行动往往难以达到人类的熟练水平

近年来,大语言模型(LLM)取得了巨大的成功,并展现出实现类人智能的潜力。由于其强大的能力,LLM 被越来越多地用作创建自主智能体的核心协调者,并出现了各种各样的AI智能体。这些智能体通过模仿类人的决策过程,为更复杂和适应性更强的AI系统提供了一条可行的路径

AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述

基于LLM的自主智能体一览,包括工具智能体、模拟智能体、通用智能体和领域智能体

对于已经出现的基于LLM的自主智能体进行整体分析,在当前阶段非常重要。这样做可以全面了解该领域的发展现状,并且对未来的研究提供启发,具有重要意义

在这篇文章中,中国人民大学高瓴人工智能学院的研究人员对基于LLM的自主智能体进行了全面调查,并关注了它们的构建、应用和评估三个方面

AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述

请点击以下链接查看论文:https://arxiv.org/pdf/2308.11432.pdf

为了构建智能体,研究者提出了一个由四部分组成的统一框架。这四部分分别是配置模块,用于表示智能体的属性;需要进行改写的内容是:记忆模块,用于存储历史信息;重新编写的内容是:设计模块,用于制定未来行动策略;以及行动模块,用于执行规划决定。在介绍了典型的智能体模块之后,研究者还总结了常用的微调策略,通过这些策略来增强智能体在不同应用场景中的适应性

研究者在接下来的内容中概述了自主智能体的潜在应用,并探讨了它们对社会科学、自然科学和工程学领域的增益。最后,讨论了自主智能体的评估方法,包括主观和客观评估策略。下图展示了文章的整体架构

AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述图源:https://github.com/Paitesanshi/LLM-Agent-Survey

基于 LLM 的自主智能体构建

为了提高基于LLM的自主智能体的效率,需要考虑两个方面:首先,设计一个能够更好利用LLM的架构;其次,有效地学习参数的方法

智能体架构设计:本文提出了一个统一的框架来总结之前研究中提出的架构,整体结构如图2所示,它由分析(profiling)模块、需要进行改写的内容是:记忆模块、重新编写的内容是:设计模块以及需要重新写作的是:动作模块组成

AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述

总结而言,重写内容为:分析模块的目的是识别智能体的角色;记忆和重新编写的内容是:设计模块可以将智能体置于动态环境中,使其能够回忆过去的行为并计划未来的行动;需要重新写作的是:动作模块负责将智能体的决策转化为具体的输出。这些模块中,重写内容为:分析模块对记忆和重新编写的内容是:设计模块产生影响,而这三个模块共同影响需要重新写作的是:动作模块

重写内容为:分析模块

自主智能体通过特定角色来执行任务,例如程序员、教师和领域专家。重写内容为:分析模块旨在表明智能体的角色是什么,这些信息通常被写入输入提示中以影响 LLM 行为。在现有的工作中,有三种常用的策略来生成智能体配置文件:手工制作方法;LLM-generation 方法;数据集对齐方法。

需要进行改写的内容是:记忆模块

需要进行改写的内容是:记忆模块在 AI 智能体的构建中起着非常重要的作用。它记忆从环境中感知到的信息,并利用记录的记忆来促进智能体未来的动作。需要进行改写的内容是:记忆模块可以帮助智能体积累经验、实现自我进化,并以更加一致、合理、有效的方式完成任务。

重新编写的内容是:设计模块

当人类面临复杂任务时,他们首先将其分解为简单的子任务,然后逐一解决每个子任务。重新编写的内容是:设计模块赋予基于 LLM 的智能体解决复杂任务时需要的思考和规划能力,使智能体更加全面、强大、可靠。本文介绍了两种重新编写的内容是:设计模块:没有反馈的规划以及有反馈的规划。

需要重新写作的是:动作模块

需要重新写作的是:动作模块的目的是将智能体的决策转化为具体的结果输出。它直接与环境进行交互,决定智能体完成任务的有效性。本节将介绍动作目标、策略、动作空间和动作影响

本章除了上述的四个部分之外,还会介绍智能体的学习策略。这些策略包括从示例中学习、从环境反馈中学习以及从与人类的互动反馈中学习

请参考表1,其中列出了之前的工作和本文的分类法之间的对应关系

AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述

基于 LLM 的自主智能体应用

本章将讨论基于LLM的自主智能体对社会科学、自然科学和工程领域的革命性影响

AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述

例如,可以利用基于LLM的智能体来设计和优化复杂的结构,如建筑物、桥梁、水坝和道路等。之前,研究人员提出了一个交互式框架,让人类建筑师和AI智能体在3D模拟中共同构建结构环境。交互式智能体能够理解自然语言指令、放置模块、寻求建议,并结合人类的反馈,展示了在工程设计中人机协作的潜力

在计算机科学和软件工程领域,基于LLM的智能体具有自动化编码、测试、调试和文档生成的潜力。研究者提出了ChatDev,这是一个端到端的框架,多个智能体通过自然语言对话进行沟通和协作,以完成软件开发生命周期。ToolBench可以用于代码自动补全和代码推荐等任务。MetaGPT可以扮演产品经理、架构师、项目经理和工程师等角色,内部监督代码生成并提高最终输出代码的质量等等

以下是基于LLM的自主智能体的代表性应用的列表:

AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述

基于 LLM 的自主智能体评估

本文将讨论两种常用的评估策略:主观评估和客观评估

需要重写的内容是:主观评估是通过人类使用互动、评分等多种方法对基于LLM的智能体的能力进行测试。通常情况下,参与评估的人员是通过众包平台招募的。然而,一些研究者认为众包人员的能力存在差异和不稳定性,因此也会使用专家注释来进行评估

在当前的一些研究中,我们可以使用LLM智能体作为主观评估者。例如,在ChemCrow研究中,EvaluatorGPT通过指定等级来评估实验结果,该等级既考虑任务的成功完成,又考虑基本思维过程的准确性。又比如,ChatEval组建了一个基于LLM的多智能体裁判小组,通过辩论来评估模型的生成结果

与主观评估相比,客观评估具有多种优势。客观评估是指使用定量指标来评估基于LLM自主智能体的能力。本节将从指标、策略和基准的角度回顾和综合客观评估方法

在评估过程中,我们可以将这两种方法结合起来使用

以下是以前的工作与这些评估策略之间的对应关系的总结:

AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述

请参考原论文以了解更多内容

今天关于《AI自主智能体的全面概览:构建、应用、评估全方位覆盖,人大高瓴文继荣等32页综述》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
Apache IoTDB:解决工业物联网场景下的存储、查询和使用难题的创新数据库Apache IoTDB:解决工业物联网场景下的存储、查询和使用难题的创新数据库
上一篇
Apache IoTDB:解决工业物联网场景下的存储、查询和使用难题的创新数据库
我们如何从 MySQL 表中获取一列或多列作为输出?
下一篇
我们如何从 MySQL 表中获取一列或多列作为输出?
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • PPTFake答辩PPT生成器:一键生成高效专业的答辩PPT
    PPTFake答辩PPT生成器
    PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
    14次使用
  • SEO标题Lovart AI:全球首个设计领域AI智能体,实现全链路设计自动化
    Lovart
    SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
    14次使用
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    27次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    26次使用
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    53次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码