使用 nodeJS 从头开始创建 ReAct Agent(维基百科搜索)
哈喽!今天心血来潮给大家带来了《使用 nodeJS 从头开始创建 ReAct Agent(维基百科搜索)》,想必大家应该对文章都不陌生吧,那么阅读本文就都不会很困难,以下内容主要涉及到,若是你正在学习文章,千万别错过这篇文章~希望能帮助到你!
介绍
我们将创建一个能够搜索维基百科并根据找到的信息回答问题的人工智能代理。该 react(理性与行动)代理使用 google generative ai api 来处理查询并生成响应。我们的代理将能够:
- 搜索维基百科获取相关信息。
- 从维基百科页面中提取特定部分。
- 对收集到的信息进行推理并制定答案。
[2] 什么是react代理?
react agent 是一种遵循反射-操作循环的特定类型的代理。它根据可用信息和它可以执行的操作反映当前任务,然后决定采取哪个操作或是否结束任务。
[3] 规划代理
3.1 所需工具
- node.js
- 用于 http 请求的 axios 库
- google 生成式 ai api (gemini-1.5-flash)
- 维基百科 api
3.2 代理结构
我们的 react agent 将具有三个主要状态:
- 思想(反思)
- 行动(执行)
- 答案(回复)
3.3 思想状态
思想状态是reactagent反思收集到的信息并决定下一步应该做什么的时刻。
async thought() { ..... }
4.4 动作状态(action)
在动作状态下,代理根据先前的想法执行可用功能之一。
请注意,存在操作(执行)和操作的决策。
这只是一个 llm 通话,内容为:
保证发送到函数的参数。
避免在 javascript 中使用大量正则表达式或转换。
async action() { // call the decision // execute the action and return a actionresult } async decideaction() { // call the llm based on the thought ( reflection ) to format and adequate the functioncall. // look around for a function-tool mode at [google dapi docs](https://ai.google.dev/gemini-api/docs/function-calling) }
[4] 实现代理
让我们逐步构建 react agent,突出显示每个状态。
4.1 初始设置
首先,设置项目并安装依赖项:
mkdir react-agent-project cd react-agent-project npm init -y npm install axios dotenv @google/generative-ai
在项目根目录创建一个 .env 文件:
google_ai_api_key=your_api_key_here
在这里获取 apikey
4.2 创建tools.js文件
使用以下内容创建 tools.js:
const axios = require("axios"); class tools { static async wikipedia(q) { try { const response = await axios.get("https://en.wikipedia.org/w/api.php", { params: { action: "query", list: "search", srsearch: q, srwhat: "text", format: "json", srlimit: 4, }, }); const results = await promise.all( response.data.query.search.map(async (searchresult) => { const sectionresponse = await axios.get( "https://en.wikipedia.org/w/api.php", { params: { action: "parse", pageid: searchresult.pageid, prop: "sections", format: "json", }, }, ); const sections = object.values( sectionresponse.data.parse.sections, ).map((section) => `${section.index}, ${section.line}`); return { pagetitle: searchresult.title, snippet: searchresult.snippet, pageid: searchresult.pageid, sections: sections, }; }), ); return results .map( (result) => `snippet: ${result.snippet}\npageid: ${result.pageid}\nsections: ${json.stringify(result.sections)}`, ) .join("\n\n"); } catch (error) { console.error("error fetching from wikipedia:", error); return "error fetching data from wikipedia"; } } static async wikipedia_with_pageid(pageid, sectionid) { if (sectionid) { const response = await axios.get("https://en.wikipedia.org/w/api.php", { params: { action: "parse", format: "json", pageid: parseint(pageid), prop: "wikitext", section: parseint(sectionid), disabletoc: 1, }, }); return object.values(response.data.parse?.wikitext ?? {})[0]?.substring( 0, 25000, ); } else { const response = await axios.get("https://en.wikipedia.org/w/api.php", { params: { action: "query", pageids: parseint(pageid), prop: "extracts", exintro: true, explaintext: true, format: "json", }, }); return object.values(response.data?.query.pages)[0]?.extract; } } } module.exports = tools;
4.3 创建reactagent.js文件
使用以下内容创建 reactagent.js:
require("dotenv").config(); const { googlegenerativeai } = require("@google/generative-ai"); const tools = require("./tools"); const genai = new googlegenerativeai(process.env.google_ai_api_key); class reactagent { constructor(query, functions) { this.query = query; this.functions = new set(functions); this.state = "thought"; this._history = []; this.model = genai.getgenerativemodel({ model: "gemini-1.5-flash", temperature: 2, }); } get history() { return this._history; } pushhistory(value) { this._history.push(`\n ${value}`); } async run() { this.pushhistory(`**task: ${this.query} **`); try { return await this.step(); } catch (e) { if (e.message.includes("exhausted")) { return "sorry, i'm exhausted, i can't process your request anymore. ><"; } return "unable to process your request, please try again? ><"; } } async step() { const colors = { reset: "\x1b[0m", yellow: "\x1b[33m", red: "\x1b[31m", cyan: "\x1b[36m", }; console.log("===================================="); console.log( `next movement: ${ this.state === "thought" ? colors.yellow : this.state === "action" ? colors.red : this.state === "answer" ? colors.cyan : colors.reset }${this.state}${colors.reset}`, ); console.log(`last movement: ${this.history[this.history.length - 1]}`); console.log("===================================="); switch (this.state) { case "thought": await this.thought(); break; case "action": await this.action(); break; case "answer": await this.answer(); break; } } async promptmodel(prompt) { const result = await this.model.generatecontent(prompt); const response = await result.response; return response.text(); } async thought() { const availablefunctions = json.stringify(array.from(this.functions)); const historycontext = this.history.join("\n"); //play around with the prompt to perceive the differences. //feel free to comment asking for guidance if anything. //feel free to comment looking for guidance. //improving the thought part can be as simple as adding this two lines to the beginning of the prompt: becoming : //your task to fullfill ${this.query}. //if you already have an answer for the task, you can go ahead and fullfill it. //otherwise you act accordingly to the following scenario >>> const prompt = `your task to fullfill ${this.query}. context contains all the reflection you made so far and the actionresult you collected. availableactions are functions you can call whenever you need more data. context: "${historycontext}" << availableactions: "${availablefunctions}" << task: "${this.query}" << reflect uppon your task using context, actionresult and availableactions to find your next_step. print your next_step with a thought or fullfill your task `; const thought = await this.promptmodel(prompt); this.pushhistory(`\n **${thought.trim()}**`); if ( thought.tolowercase().includes("fullfill") || thought.tolowercase().includes("fulfill") ) { this.state = "answer"; return await this.step(); } this.state = "action"; return await this.step(); } async action() { const action = await this.decideaction(); this.pushhistory(`** action: ${action} **`); const result = await this.executefunctioncall(action); this.pushhistory(`** actionresult: ${result} **`); this.state = "thought"; return await this.step(); } async decideaction() { const availablefunctions = json.stringify(array.from(this.functions)); const historycontext = this.history; const prompt = `reflect uppon the thought, query and availableactions ${historycontext[historycontext.length - 2]} thought <<< ${historycontext[historycontext.length - 1]} query: "${this.query}" availableactions: ${availablefunctions} output only the function,parametervalues separated by a comma. for example: "wikipedia,ronaldinho gaucho, 1450"`; const decision = await this.promptmodel(prompt); return `${decision.replace(/`/g, "").trim()}`; } async executefunctioncall(functioncall) { const [functionname, ...args] = functioncall.split(","); const func = tools[functionname.trim()]; if (func) { return await func.call(null, ...args); } throw new error(`function ${functionname} not found`); } async answer() { const historycontext = this.history; const prompt = `based on the following context, provide a complete, detailed and descriptive formated answer for the following task: ${this.query} . context: ${historycontext} task: "${this.query}"`; const finalanswer = await this.promptmodel(prompt); this.history.push(`answer: ${this.finalanswer}`); console.log("we will answer >>>>>>>", finalanswer); return finalanswer; } } module.exports = reactagent;
4.4 运行代理(index.js)
使用以下内容创建index.js:
const ReActAgent = require("./ReactAgent.js"); async function main() { const query = "What does England border with?"; // const query = "what are the neighbourhoods of Joinville?"; // const query = "what is the capital of France?"; // const query = "What does england borders with?"; // const query = "what is the color of the sky?"; const functions = [ [ "wikipedia", "params: query", "Semantic Search Wikipedia API for snippets, pageIds and sectionIds >> \n ex: Date brazil has been colonized? \n Brazil was colonized at 1500, pageId, sections : []", ], [ "wikipedia_with_pageId", "params : pageId, sectionId", "Search Wikipedia API for data using a pageId and a sectionIndex as params. \n ex: 1500, 1234 \n Section information about blablalbal", ], ]; const agent = new ReActAgent(query, functions); try { const result = await agent.run(); console.log("THE AGENT RETURN THE FOLLOWING >>>", result); } catch (e) { console.log("FAILED TO RUN T.T", e); } } main().catch(console.error);
[5] 维基百科部分如何运作
与维基百科的交互主要分为两个步骤:
-
初始搜索(维基百科功能):
- 向维基百科搜索 api 发出请求。
- 最多返回 4 个相关的查询结果。
- 对于每个结果,它都会获取页面的各个部分。
-
详细搜索(wikipedia_with_pageid函数):
- 使用页面 id 和部分 id 来获取特定内容。
- 返回请求部分的文本。
此过程允许代理首先获得与查询相关的主题的概述,然后根据需要深入研究特定部分。
[6] 执行流程示例
- 用户提出问题。
- 智能体进入思考状态并反思问题。
- 它决定搜索维基百科并进入 action 状态。
- 执行wikipedia函数并获取结果。
- 返回thought状态反思结果。
- 可能决定搜索更多详细信息或不同的方法。
- 根据需要重复思想和行动循环。
- 当它有足够的信息时,它进入answer状态。
- 根据收集到的所有信息生成最终答案。
- 只要维基百科没有可收集的数据,就会进入无限循环。用计时器修复它=p
[7] 最后的考虑
- 模块化结构可以轻松添加新工具或 api。
- 实施错误处理和时间/迭代限制非常重要,以避免无限循环或过度资源使用。
- 此示例使用温度 2。温度越小,该代理在轮流中的创造力就越少。尝试使用它来感知 llms 中温度的影响。
以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于文章的相关知识,也可关注golang学习网公众号。

- 上一篇
- Quarkus 简介:Kubernetes 的 Java Native

- 下一篇
- 理解 TypeScript 中的 infer 关键字
-
- 文章 · 前端 | 4小时前 |
- JavaScript中IntersectionObserverAPI的使用技巧
- 447浏览 收藏
-
- 文章 · 前端 | 4小时前 |
- JavaScript本地存储(localStorage)实战攻略
- 309浏览 收藏
-
- 文章 · 前端 | 5小时前 |
- Vue.jsCompositionAPI与OptionsAPI使用对比
- 420浏览 收藏
-
- 文章 · 前端 | 5小时前 |
- JavaScriptArray.filter用法详解与实例
- 383浏览 收藏
-
- 文章 · 前端 | 6小时前 | 鼠标事件 跨浏览器兼容性 拖拽功能 transform属性 触摸设备支持
- JavaScript拖拽功能实现技巧与代码示例
- 159浏览 收藏
-
- 文章 · 前端 | 6小时前 | 异步操作 生成器函数 async/await yield 无限序列
- JavaScript生成器函数创建终极攻略
- 161浏览 收藏
-
- 文章 · 前端 | 6小时前 |
- 前端开发CSS悬停内缩并显示图标技巧
- 460浏览 收藏
-
- 文章 · 前端 | 6小时前 |
- JavaScript如何将数据存入LocalStorage?
- 327浏览 收藏
-
- 文章 · 前端 | 6小时前 | TypeScript 类型转换 类型检查 特殊情况 复杂数据结构
- JavaScript搞定类型错误的终极攻略
- 119浏览 收藏
-
- 文章 · 前端 | 6小时前 | JavaScript 时间复杂度 快速排序 原地排序 基准元素
- JavaScript快速排序算法实现详解
- 372浏览 收藏
-
- 文章 · 前端 | 7小时前 |
- JavaScript中ShadowDOM使用技巧揭秘
- 335浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 26次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 21次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 23次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 23次使用
-
- Brev AI
- 探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
- 25次使用
-
- 优化用户界面体验的秘密武器:CSS开发项目经验大揭秘
- 2023-11-03 501浏览
-
- 使用微信小程序实现图片轮播特效
- 2023-11-21 501浏览
-
- 解析sessionStorage的存储能力与限制
- 2024-01-11 501浏览
-
- 探索冒泡活动对于团队合作的推动力
- 2024-01-13 501浏览
-
- UI设计中为何选择绝对定位的智慧之道
- 2024-02-03 501浏览