当前位置:首页 > 文章列表 > 文章 > 前端 > 使用 nodeJS 从头开始​​创建 ReAct Agent(维基百科搜索)

使用 nodeJS 从头开始​​创建 ReAct Agent(维基百科搜索)

来源:dev.to 2024-10-01 19:31:01 0浏览 收藏

哈喽!今天心血来潮给大家带来了《使用 nodeJS 从头开始​​创建 ReAct Agent(维基百科搜索)》,想必大家应该对文章都不陌生吧,那么阅读本文就都不会很困难,以下内容主要涉及到,若是你正在学习文章,千万别错过这篇文章~希望能帮助到你!

使用 nodeJS 从头开始​​创建 ReAct Agent(维基百科搜索)

介绍

我们将创建一个能够搜索维基百科并根据找到的信息回答问题的人工智能代理。该 react(理性与行动)代理使用 google generative ai api 来处理查询并生成响应。我们的代理将能够:

  1. 搜索维基百科获取相关信息。
  2. 从维基百科页面中提取特定部分。
  3. 对收集到的信息进行推理并制定答案。

[2] 什么是react代理?

react agent 是一种遵循反射-操作循环的特定类型的代理。它根据可用信息和它可以执行的操作反映当前任务,然后决定采取哪个操作或是否结束任务。

[3] 规划代理

3.1 所需工具

  • node.js
  • 用于 http 请求的 axios 库
  • google 生成式 ai api (gemini-1.5-flash)
  • 维基百科 api

3.2 代理结构

我们的 react agent 将具有三个主要状态:

  1. 思想(反思)
  2. 行动(执行)
  3. 答案(回复)

3.3 思想状态

思想状态是reactagent反思收集到的信息并决定下一步应该做什么的时刻。

async thought() {
 .....
}

4.4 动作状态(action)

在动作状态下,代理根据先前的想法执行可用功能之一。
请注意,存在操作(执行)和操作的决策。
这只是一个 llm 通话,内容为:
保证发送到函数的参数。
避免在 javascript 中使用大量正则表达式或转换。

async action() {
 // call the decision 
 // execute the action and return a actionresult
}

async decideaction() {
 // call the llm based on the thought ( reflection ) to format and adequate the functioncall.
// look around for a function-tool mode at [google dapi docs](https://ai.google.dev/gemini-api/docs/function-calling)
}

[4] 实现代理

让我们逐步构建 react agent,突出显示每个状态。

4.1 初始设置

首先,设置项目并安装依赖项:

mkdir react-agent-project
cd react-agent-project
npm init -y
npm install axios dotenv @google/generative-ai

在项目根目录创建一个 .env 文件:

google_ai_api_key=your_api_key_here

在这里获取 apikey

4.2 创建tools.js文件

使用以下内容创建 tools.js:

const axios = require("axios");

class tools {
  static async wikipedia(q) {
    try {
      const response = await axios.get("https://en.wikipedia.org/w/api.php", {
        params: {
          action: "query",
          list: "search",
          srsearch: q,
          srwhat: "text",
          format: "json",
          srlimit: 4,
        },
      });

      const results = await promise.all(
        response.data.query.search.map(async (searchresult) => {
          const sectionresponse = await axios.get(
            "https://en.wikipedia.org/w/api.php",
            {
              params: {
                action: "parse",
                pageid: searchresult.pageid,
                prop: "sections",
                format: "json",
              },
            },
          );

          const sections = object.values(
            sectionresponse.data.parse.sections,
          ).map((section) => `${section.index}, ${section.line}`);

          return {
            pagetitle: searchresult.title,
            snippet: searchresult.snippet,
            pageid: searchresult.pageid,
            sections: sections,
          };
        }),
      );

      return results
        .map(
          (result) =>
            `snippet: ${result.snippet}\npageid: ${result.pageid}\nsections: ${json.stringify(result.sections)}`,
        )
        .join("\n\n");
    } catch (error) {
      console.error("error fetching from wikipedia:", error);
      return "error fetching data from wikipedia";
    }
  }

  static async wikipedia_with_pageid(pageid, sectionid) {
    if (sectionid) {
      const response = await axios.get("https://en.wikipedia.org/w/api.php", {
        params: {
          action: "parse",
          format: "json",
          pageid: parseint(pageid),
          prop: "wikitext",
          section: parseint(sectionid),
          disabletoc: 1,
        },
      });
      return object.values(response.data.parse?.wikitext ?? {})[0]?.substring(
        0,
        25000,
      );
    } else {
      const response = await axios.get("https://en.wikipedia.org/w/api.php", {
        params: {
          action: "query",
          pageids: parseint(pageid),
          prop: "extracts",
          exintro: true,
          explaintext: true,
          format: "json",
        },
      });
      return object.values(response.data?.query.pages)[0]?.extract;
    }
  }
}

module.exports = tools;

4.3 创建reactagent.js文件

使用以下内容创建 reactagent.js:

require("dotenv").config();
const { googlegenerativeai } = require("@google/generative-ai");
const tools = require("./tools");

const genai = new googlegenerativeai(process.env.google_ai_api_key);

class reactagent {
  constructor(query, functions) {
    this.query = query;
    this.functions = new set(functions);
    this.state = "thought";
    this._history = [];
    this.model = genai.getgenerativemodel({
      model: "gemini-1.5-flash",
      temperature: 2,
    });
  }

  get history() {
    return this._history;
  }

  pushhistory(value) {
    this._history.push(`\n ${value}`);
  }

  async run() {
    this.pushhistory(`**task: ${this.query} **`);
    try {
      return await this.step();
    } catch (e) {
      if (e.message.includes("exhausted")) {
        return "sorry, i'm exhausted, i can't process your request anymore. ><";
      }
      return "unable to process your request, please try again? ><";
    }
  }

  async step() {
    const colors = {
      reset: "\x1b[0m",
      yellow: "\x1b[33m",
      red: "\x1b[31m",
      cyan: "\x1b[36m",
    };

    console.log("====================================");
    console.log(
      `next movement: ${
        this.state === "thought"
          ? colors.yellow
          : this.state === "action"
            ? colors.red
            : this.state === "answer"
              ? colors.cyan
              : colors.reset
      }${this.state}${colors.reset}`,
    );
    console.log(`last movement: ${this.history[this.history.length - 1]}`);
    console.log("====================================");
    switch (this.state) {
      case "thought":
        await this.thought();
        break;
      case "action":
        await this.action();
        break;
      case "answer":
        await this.answer();
        break;
    }
  }

  async promptmodel(prompt) {
    const result = await this.model.generatecontent(prompt);
    const response = await result.response;
    return response.text();
  }


  async thought() {
    const availablefunctions = json.stringify(array.from(this.functions));
    const historycontext = this.history.join("\n");

//play around with the prompt to perceive the differences.
//feel free to comment asking for guidance if anything.
//feel free to comment looking for guidance.
//improving the thought part can be as simple as adding this two lines to the beginning of the prompt: becoming :  

//your task to fullfill ${this.query}.
//if you already have an answer for the task, you can go ahead and 
fullfill it.
//otherwise you act accordingly to the following scenario >>>


    const prompt = `your task to fullfill ${this.query}.
context contains all the reflection you made so far and the actionresult you collected.
availableactions are functions you can call whenever you need more data.

context: "${historycontext}" <<

availableactions: "${availablefunctions}" <<

task: "${this.query}" <<

reflect uppon your task using context, actionresult and availableactions to find your next_step.
print your next_step with a thought or fullfill your task `;

    const thought = await this.promptmodel(prompt);
    this.pushhistory(`\n **${thought.trim()}**`);
    if (
      thought.tolowercase().includes("fullfill") ||
      thought.tolowercase().includes("fulfill")
    ) {
      this.state = "answer";
      return await this.step();
    }
    this.state = "action";
    return await this.step();
  }

  async action() {
    const action = await this.decideaction();
    this.pushhistory(`** action: ${action} **`);
    const result = await this.executefunctioncall(action);
    this.pushhistory(`** actionresult: ${result} **`);
    this.state = "thought";
    return await this.step();
  }

  async decideaction() {
    const availablefunctions = json.stringify(array.from(this.functions));
    const historycontext = this.history;
    const prompt = `reflect uppon the thought, query and availableactions

    ${historycontext[historycontext.length - 2]}

    thought <<< ${historycontext[historycontext.length - 1]}

    query: "${this.query}"

    availableactions: ${availablefunctions}

    output only the function,parametervalues separated by a comma. for example: "wikipedia,ronaldinho gaucho, 1450"`;

    const decision = await this.promptmodel(prompt);
    return `${decision.replace(/`/g, "").trim()}`;
  }

  async executefunctioncall(functioncall) {
    const [functionname, ...args] = functioncall.split(",");
    const func = tools[functionname.trim()];
    if (func) {
      return await func.call(null, ...args);
    }
    throw new error(`function ${functionname} not found`);
  }

  async answer() {
    const historycontext = this.history;
    const prompt = `based on the following context, provide a complete, detailed and descriptive formated answer for the following task: ${this.query} .

context:
${historycontext}

task: "${this.query}"`;

    const finalanswer = await this.promptmodel(prompt);
    this.history.push(`answer: ${this.finalanswer}`);
    console.log("we will answer >>>>>>>", finalanswer);
    return finalanswer;
  }
}

module.exports = reactagent;

4.4 运行代理(index.js)

使用以下内容创建index.js:

const ReActAgent = require("./ReactAgent.js");

async function main() {
  const query = "What does England border with?";
  // const query = "what are the neighbourhoods of Joinville?";
  // const query = "what is the capital of France?";
  // const query = "What does england borders with?";
  // const query = "what is the color of the sky?";
  const functions = [
    [
      "wikipedia",
      "params: query",
      "Semantic Search Wikipedia API for snippets, pageIds and sectionIds >> \n ex: Date brazil has been colonized? \n Brazil was colonized at 1500, pageId, sections : []",
    ],
    [
      "wikipedia_with_pageId",
      "params : pageId, sectionId",
      "Search Wikipedia API for data using a pageId and a sectionIndex as params.  \n ex: 1500, 1234 \n Section information about blablalbal",
    ],
  ];

  const agent = new ReActAgent(query, functions);
  try {
    const result = await agent.run();
    console.log("THE AGENT RETURN THE FOLLOWING >>>", result);
  } catch (e) {
    console.log("FAILED TO RUN T.T", e);
  }
}

main().catch(console.error);

[5] 维基百科部分如何运作

与维基百科的交互主要分为两个步骤:

  1. 初始搜索(维基百科功能):

    • 向维基百科搜索 api 发出请求。
    • 最多返回 4 个相关的查询结果。
    • 对于每个结果,它都会获取页面的各个部分。
  2. 详细搜索(wikipedia_with_pageid函数):

    • 使用页面 id 和部分 id 来获取特定内容。
    • 返回请求部分的文本。

此过程允许代理首先获得与查询相关的主题的概述,然后根据需要深入研究特定部分。

[6] 执行流程示例

  1. 用户提出问题。
  2. 智能体进入思考状态并反思问题。
  3. 它决定搜索维基百科并进入 action 状态。
  4. 执行wikipedia函数并获取结果。
  5. 返回thought状态反思结果。
  6. 可能决定搜索更多详细信息或不同的方法。
  7. 根据需要重复思想和行动循环。
  8. 当它有足够的信息时,它进入answer状态。
  9. 根据收集到的所有信息生成最终答案。
  10. 只要维基百科没有可收集的数据,就会进入无限循环。用计时器修复它=p

[7] 最后的考虑

  • 模块化结构可以轻松添加新工具或 api。
  • 实施错误处理和时间/迭代限制非常重要,以避免无限循环或过度资源使用。
  • 此示例使用温度 2。温度越小,该代理在轮流中的创造力就越少。尝试使用它来感知 llms 中温度的影响。

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于文章的相关知识,也可关注golang学习网公众号。

版本声明
本文转载于:dev.to 如有侵犯,请联系study_golang@163.com删除
Quarkus 简介:Kubernetes 的 Java NativeQuarkus 简介:Kubernetes 的 Java Native
上一篇
Quarkus 简介:Kubernetes 的 Java Native
理解 TypeScript 中的 infer 关键字
下一篇
理解 TypeScript 中的 infer 关键字
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    26次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    21次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    23次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    23次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    25次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码