GenericAgent:A3 Lab 通用自进化LLM系统
2026-05-15 12:24:42
0浏览
收藏
GenericAgent是由A3 Lab推出的革命性通用自进化LLM智能体系统,以“上下文信息密度最大化”为设计灵魂,仅用9个原子工具、3300行极简代码和30k token上下文窗口,就在Lifelong AgentBench上达成100%任务完成率,token消耗仅为Claude Code的27.7%、OpenClaw的15.5%;它通过四层分层记忆架构实现经验沉淀为可复用SOP与代码,支持跨任务自主进化,并在网页交互、长程软件工程、金融分析等复杂场景中展现出远超竞品的效率与鲁棒性——这不是又一个臃肿的Agent框架,而是一个真正能越用越聪明、越用越轻快、且人人可自托管部署的下一代智能体操作系统。
GenericAgent是什么
GenericAgent(GA)是 A3 Lab 推出的通用自进化 LLM Agent 系统,以”上下文信息密度最大化”为核心设计原则。GenericAgent通过 9 个原子工具、30k 上下文窗口和四层分层记忆架构,在 Lifelong AgentBench 上实现 100% 任务完成率,token 消耗为 Claude Code 的 27.7% 和 OpenClaw 的 15.5%。GenericAgent支持经验沉淀为可复用 SOP 与可执行代码,具备跨任务自进化能力,代码量仅 3300 行,以自托管 CLI 形式运行。

GenericAgent的主要功能
- 极简原子工具集:提供 file_read、file_patch、file_write、code_run、web_scan、web_execute_js、update_working_checkpoint、start_long_term_update、ask_user 共 9 个原子工具,覆盖文件操作、代码执行、网页交互、记忆管理与人工介入五大能力域。
- 分层按需记忆:采用 L0 元规则、L1 索引层、L2 事实层、L3 SOP 层、L4 原始归档层的四级架构,用 L1 常驻上下文,深层记忆按需显式读取。
- 自进化能力:将验证后的执行轨迹沉淀为可复用 SOP 文件与可执行脚本,遵循”No Execution, No Memory”原则,实现跨任务经验累积与能力进化。
- 上下文压缩管理:通过工具输出截断、标签级压缩、消息驱逐与工作记忆锚点四阶段策略,将活跃上下文稳在 30k token 以内。
- 双模式执行:支持 Interact 模式处理用户主动任务,以及 Reflect 模式作为 Watchdog 自动监测环境变化并触发任务。
GenericAgent的技术原理
- 上下文信息密度最大化:将上下文质量拆解为完整性(Completeness)、简洁性(Conciseness)与自然性(Naturalness)三维度,通过极简工具、分层记忆、自进化与压缩机制,在有限窗口内最大化决策相关信息比例。
- 工具最小化与组合泛化:基于原子性(不可再拆)与组合泛化(复杂行为通过序列组合实现)两个条件,保留 9 个原子工具,避免工具膨胀带来的 prompt 开销与策略歧义。
- 分层记忆架构:L1 索引层仅记录”某类知识存在”而非内容,由 LLM 充当解码器按需取回;引入 meta-memory 元记忆层定义全局规则与更新边界;采用触发式提交而非即时写入,经验经验证后才增量写入长期记忆。
- 自进化管道:工具层与知识层分离,新任务学习不干扰既有技能;在里程碑事件触发整合阶段,保留经成功工具执行验证的内容;引入三级失败升级机制(局部修复→策略切换→人工介入)防止错误循环。
- 四阶段上下文截断:阶段一按字符阈值裁剪工具返回值;阶段二每约 5 轮替换重复工作记忆块并截断标签内容;阶段三按 FIFO 驱逐最旧消息;阶段四附加工作记忆锚点作为长期记忆唯一来源。
如何使用GenericAgent
- 环境准备:确保本地具备 Python 运行环境,准备好兼容的 LLM API Key(支持 Claude、GPT、Gemini 等后端)。
- 获取代码:通过论文发布渠道(arXiv:2604.17091)获取约 3300 行核心源码与部署指引。
- 配置安装:在本地完成依赖安装与 LLM 后端配置,设定 30k token 的上下文预算与字符预算阈值。
- 启动运行:以自托管 CLI 形式启动 GA,进入 Interact 模式可直接输入任务指令,或配置 Reflect 模式的触发脚本实现自动监测。
- 任务执行:Agent 基于当前任务与相关记忆构建执行上下文,生成工具调用或输出,通过结构化反馈更新系统状态。
- 经验沉淀:任务完成后,系统自动将验证后的执行轨迹压缩并归档至 L4,经触发整合后沉淀为 L2/L3 长期记忆,供后续任务复用。
GenericAgent的关键信息和使用要求
- 开发团队:由 A3 Lab(Advantage AI Agent Lab,深圳 Aquaintelling 科技与复旦大学联合研究团队)开发。
- 开源形态:核心代码约 3300 行,中央 Agent Loop 仅 92 行,以自托管 CLI 程序形式部署,命令行为原生执行界面。
- 模型兼容:模型无关架构,支持 Claude、GPT、Gemini 等主流 LLM 后端,可替换而不影响执行逻辑与工具接口。
- 上下文预算:默认将活跃上下文控制在 30k token 以内,采用字符域启发式(α≈3 chars/token)进行预算管理。
- 执行边界:单会话默认 30 轮执行上限,支持通过子 Agent 派发实现多进程隔离与长程任务拆分。
- 使用门槛:需配置 LLM API Key,具备本地计算环境运行权限,适合有技术背景的用户自托管部署。
GenericAgent的核心优势
- 极致 Token 效率:在 Lifelong AgentBench 上用 222k 输入 token 实现 100% 完成率,较 Claude Code 降低 72.3%,较 OpenClaw 降低 84.5%。
- 持续自进化:9 轮重复任务后 token 消耗下降 89.6%,LLM 调用从 32 次收敛至 5 次,实现”冷启动-快速收敛”的复利效应。
- 极简架构:3300 行核心代码 vs OpenClaw 的 53 万行,极简设计使 Agent 具备读懂并修改自身架构的潜力。
- 高密度记忆:装入 20 个技能后完整 prompt 仅 2298 token,较 Claude Code(22821)、Codex(23932)、OpenClaw(43321)降低一个数量级。
- 强网页能力:在 WebCanvas、BrowseComp-ZH、Custom Tasks 上得分均超 OpenClaw,token 消耗仅为其 1/4-1/3。
GenericAgent的项目地址
- GitHub仓库:http://github.com/lsdefine/GenericAgent
- arXiv技术论文:http://arxiv.org/pdf/2604.17091
GenericAgent的同类竞品对比
| 维度 | GenericAgent | OpenClaw | Claude Code |
|---|---|---|---|
| 核心代码量 | ~3,300 行 | ~530,000 行 | 未公开 |
| 原子工具数 | 9 个 | 18 个工具工厂 + 插件 | 53 个 |
| 上下文策略 | 30k 压缩窗口 | 依赖 1M 扩展窗口 | 依赖长上下文 |
| Lifelong AgentBench 完成率 | 100% | 70% | 75% |
| Lifelong AgentBench 输入 Token | 222k | 1.43M | 800k |
| 自进化能力 | 经验沉淀为 SOP/代码 | 无显著收敛趋势 | 无跨会话记忆 |
| 记忆架构 | 四层分层按需加载 | 检索增强原始日志 | 无持久记忆 |
| 网页浏览 Token 效率 | 0.18M (WebCanvas) | 0.71M | 未评测 |
GenericAgent的应用场景
- 长程软件工程:GenericAgent支持 GitHub 仓库研究、多文件代码重构、复杂代码编辑与调试等需要持续多轮交互的开发任务。
- 自动化网页浏览:GenericAgent能执行电商价格比较、上市公司报告提取、航班查询导出、新闻订阅流验证等需要跨页面操作的信息检索任务。
- 金融与商业分析:在 RealFin-benchmark 等场景中完成动态金融数据爬取、财务报表分析等数据密集型研究任务。
- 政府与教育机构服务导航:完成政府服务网站导航、大学课程归档等需要跨页面状态转移的复杂流程自动化。
- 终身个人助手:作为跨会话累积用户偏好、工作习惯与外部服务知识的个人 Agent,持续进化以适配用户长期需求。
到这里,我们也就讲完了《GenericAgent:A3 Lab 通用自进化LLM系统》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!
CSS动画弹窗优化技巧
- 上一篇
- CSS动画弹窗优化技巧
- 下一篇
- Windows动态磁盘转基本磁盘教程
查看更多
最新文章
-
- 科技周边 · 人工智能 | 3分钟前 | DeepSeek
- 服务器繁忙别慌!DeepSeek防卡顿3技巧
- 104浏览 收藏
-
- 科技周边 · 人工智能 | 6分钟前 |
- Midjourney视频生成教程:新手入门指南
- 319浏览 收藏
-
- 科技周边 · 人工智能 | 15分钟前 | ToClawI
- ToClaw脚本录制与执行全流程解析
- 131浏览 收藏
-
- 科技周边 · 人工智能 | 21分钟前 |
- 腾讯云携手虹魔方,共筑AI玩具新生态
- 425浏览 收藏
-
- 科技周边 · 人工智能 | 25分钟前 | Hermes Agent HermesAgent
- HermesAgent升级教程:如何平滑更新到最新版
- 347浏览 收藏
-
- 科技周边 · 人工智能 | 33分钟前 |
- Figma画板混乱?用Organizer插件快速对齐命名
- 468浏览 收藏
-
- 科技周边 · 人工智能 | 40分钟前 | openclaw
- OpenClaw搭建AI知识库全攻略
- 173浏览 收藏
-
- 科技周边 · 人工智能 | 43分钟前 | DeepSeek
- Dify接入DeepSeek模型教程详解
- 345浏览 收藏
-
- 科技周边 · 人工智能 | 45分钟前 |
- GenericAgent:A3 Lab 通用自进化LLM系统
- 483浏览 收藏
-
- 科技周边 · 人工智能 | 46分钟前 |
- AI志愿助手冲稳保设置教程
- 192浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 免费AI抠图推荐:Slazzer与PixianAI体验指南
- 160浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
查看更多
AI推荐
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 4517次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 4870次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 4743次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 6603次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 5104次使用
查看更多
相关文章
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览

