当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 构建企业级人工智能平台:利用RAG和CRAG实现商业人工智能的掌握

构建企业级人工智能平台:利用RAG和CRAG实现商业人工智能的掌握

来源:51CTO.COM 2024-03-04 18:18:27 0浏览 收藏

小伙伴们对科技周边编程感兴趣吗?是否正在学习相关知识点?如果是,那么本文《构建企业级人工智能平台:利用RAG和CRAG实现商业人工智能的掌握》,就很适合你,本篇文章讲解的知识点主要包括。在之后的文章中也会多多分享相关知识点,希望对大家的知识积累有所帮助!

浏览我们的指南,掌握如何让您的企业充分利用人工智能技术。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程等内容,这对那些希望负责任地应用人工智能的企业来说非常有益。

为企业打造AI-Ready平台

企业引入生成式人工智能时,会遇到许多需要战略管理的业务风险。这些风险通常是相互关联的,范围从导致合规问题的潜在偏见到缺乏领域知识。主要问题包括声誉损害、遵守法律和监管标准(尤其是与客户互动有关)、知识产权侵权、道德问题和隐私问题(尤其是在处理个人或可识别数据时)。

为了应对这些挑战,提议采用检索增强生成(RAG)等混合策略。RAG技术能够提高人工智能生成内容的质量,使企业人工智能计划更为安全可靠。这一策略能够有效解决知识缺失和错误信息等问题,同时也确保遵守法律和道德准则,防止声誉受损和违规行为的发生。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

了解检索增强生成 (RAG)

检索增强生成(RAG)是一种先进方法,通过集成企业知识库中的信息来提高人工智能内容创建的准确性和可靠性。将 RAG 视为一位大厨,他依靠与生俱来的天赋、全面的培训和创意天赋,所有这些都得到了对烹饪基础知识的透彻理解的支持。当需要使用不寻常的香料或满足对新颖菜肴的要求时,厨师会查阅可靠的烹饪参考资料,以确保成分得到最佳利用。

就像一名大厨可以烹饪出多样的美食一样,GPT和LLaMA-2等人工智能系统也能生成各种主题的内容。然而,当需要提供详细准确的信息时,尤其是在处理新颖的美食或浏览大量企业数据时,它们会借助特殊工具来确保信息的准确性和深度。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

如果 RAG 的检索阶段不充分怎么办?

CRAG是一种纠正性干预,旨在加强RAG设置的稳定性。CRAG利用T5来评估检索到的文档的相关性。当企业来源的文档被视为不相关时,可能会通过网络搜索来填补信息空白。

企业级生成人工智能解决方案的架构注意事项

架构从根本上是围绕三个核心支柱构建的:数据摄入、查询和智能检索、生成提示工程和大语言模型

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

数据第一步是将公司文档的内容转换为易于查询的格式。此转换是使用嵌入模型完成的,遵循以下操作序列

  1. 数据分段:来自企业知识源(例如 Confluence、Jira 和 PDF)的各种文档被提取到系统中。此步骤涉及将文档分解为可管理的部分,通常称为“块”。
  2. 嵌入模型:然后将这些文档块传递给嵌入模型。嵌入模型是一种神经网络,它将文本转换为表示文本语义的数字形式(向量),使其能够被机器理解。
  3. 索引块:然后对嵌入模型产生的向量进行索引。索引是以有利于高效检索的方式组织数据的过程。
  4. 矢量数据库:将所有矢量嵌入保存在矢量数据库中。并将每个嵌入表示的文本保存在不同的文件中,确保包含对相应嵌入的引用。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

查询和智能检索:推理服务器收到用户的问题后,就会通过嵌入过程将其转换为向量,该过程使用相同的模型在知识库中嵌入文档。然后,向量数据库进行搜索,以识别与用户意图密切相关的向量,并将其提供给大型语言模型 (LLM) 以丰富上下文。

5.查询:从应用程序和API层进行查询。该查询是用户或其他应用程序在搜索信息时输入的内容。

6.嵌入查询检索:利用生成的 Vector.Embedding 在矢量数据库的索引中开始搜索。选择您想要从矢量数据库中检索的矢量数量;这个数字将与您计划编译和用于解决问题的上下文数量成正比。

7.向量(相似向量):该过程识别相似向量,这些向量表示与查询上下文相关的文档块

8.检索相关向量:
从向量数据库中检索相关向量。例如,在厨师的背景下,它可能相当于两个相关向量:食谱和准备步骤。相应的片段将被收集并随提示一起提供。

9.检索相关块:系统获取与被识别为与查询相关的向量相匹配的文档部分。一旦评估了信息的相关性,系统就会确定后续步骤。如果信息完全一致,它会根据重要性进行排列。如果信息不正确,系统会将其丢弃并在线查找更好的信息。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

生成提示工程和LLMs生成提示工程对于指导大型语言模型给出正确答案至关重要。它涉及创建考虑到任何数据差距的清晰而精确的问题。这个过程是持续进行的,需要定期调整以获得更好的响应。确保这些问题合乎道德、没有偏见并避免敏感话题也很重要。

10. 提示工程:然后将检索到的块与原始查询一起使用以创建提示。该提示旨在有效地将查询上下文传达给语言模型。

11. LLM(大型语言模型):工程提示由大型语言模型处理。这些模型可以根据收到的输入生成类似人类的文本。

12. 答案:最后,语言模型使用提示提供的上下文和检索到的块来生成查询的答案。然后,该答案通过应用程序和 API 层发送回用户。

结论

本博客探讨了将人工智能集成到软件开发中的复杂过程,强调了受 CRAG 启发建立企业生成人工智能平台的变革潜力。通过解决即时工程、数据管理和创新检索增强生成 (RAG) 方法的复杂性,我们概述了将人工智能技术纳入业务运营核心的方法。未来的讨论将进一步深入探讨智能开发的生成式人工智能框架,研究最大限度地利用人工智能的具体工具、技术和策略,确保更智能、更高效的开发环境。

来源 | https://medium.com/@genengineerAI/mastering-ai-in-business-building-an-enterprise-ready-ai-platform-with-rag-and-crag-b38baac8ad8b

作者 | Venkat Rangasamy

今天关于《构建企业级人工智能平台:利用RAG和CRAG实现商业人工智能的掌握》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
“深入理解 SOLID 原则及在 PHP 面向对象设计模式中的应用”“深入理解 SOLID 原则及在 PHP 面向对象设计模式中的应用”
上一篇
“深入理解 SOLID 原则及在 PHP 面向对象设计模式中的应用”
Go语言开发职位需求旺盛,大型公司正在积极招聘!
下一篇
Go语言开发职位需求旺盛,大型公司正在积极招聘!
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    514次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    499次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • SEO  AI Mermaid 流程图:自然语言生成,文本驱动可视化创作
    AI Mermaid流程图
    SEO AI Mermaid 流程图工具:基于 Mermaid 语法,AI 辅助,自然语言生成流程图,提升可视化创作效率,适用于开发者、产品经理、教育工作者。
    237次使用
  • 搜获客笔记生成器:小红书医美爆款内容AI创作神器
    搜获客【笔记生成器】
    搜获客笔记生成器,国内首个聚焦小红书医美垂类的AI文案工具。1500万爆款文案库,行业专属算法,助您高效创作合规、引流的医美笔记,提升运营效率,引爆小红书流量!
    207次使用
  • iTerms:一站式法律AI工作台,智能合同审查起草与法律问答专家
    iTerms
    iTerms是一款专业的一站式法律AI工作台,提供AI合同审查、AI合同起草及AI法律问答服务。通过智能问答、深度思考与联网检索,助您高效检索法律法规与司法判例,告别传统模板,实现合同一键起草与在线编辑,大幅提升法律事务处理效率。
    242次使用
  • TokenPony:AI大模型API聚合平台,一站式接入,高效稳定高性价比
    TokenPony
    TokenPony是讯盟科技旗下的AI大模型聚合API平台。通过统一接口接入DeepSeek、Kimi、Qwen等主流模型,支持1024K超长上下文,实现零配置、免部署、极速响应与高性价比的AI应用开发,助力专业用户轻松构建智能服务。
    201次使用
  • 迅捷AIPPT:AI智能PPT生成器,高效制作专业演示文稿
    迅捷AIPPT
    迅捷AIPPT是一款高效AI智能PPT生成软件,一键智能生成精美演示文稿。内置海量专业模板、多样风格,支持自定义大纲,助您轻松制作高质量PPT,大幅节省时间。
    229次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码