当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > RAG 答非所问怎么排查:从切块、向量到召回上下文

RAG 答非所问怎么排查:从切块、向量到召回上下文

来源:17golang原创 2026-06-27 19:54:24 0浏览 收藏

RAG 应用上线后,最常见的抱怨不是“模型不会回答”,而是“资料明明在知识库里,回答却像没读到”。这类问题通常不能只调 prompt。RAG 的答案质量取决于文档切块、向量化、检索召回、排序、上下文拼接和模型生成,每一层都可能丢信息。

本文按排查现场来走:先复现答非所问,再拆开检索链路,确认问题到底出在切块、向量、top-k、混合检索还是上下文过长。

目录
  • 问题现场:资料存在,回答却偏题
  • 初步判断:先拆开 RAG 链路
  • 动手验证:打印召回片段和分数
  • 定位原因:切块、向量和排序分别怎么看
  • 修复方案:让正确片段进入上下文
  • 验证结果:用固定问题集复查
  • 总结:一张排查清单

问题现场:资料存在,回答却偏题

假设我们做了一个企业制度问答助手,用户问:

远程办公员工转正后,设备补贴能报销多少?

知识库里确实有制度文档,但助手回答成了“入职设备领取流程”。这说明生成模型不是完全乱答,而是拿到了相邻但不够精确的材料。现在要验证的是:检索层有没有把“远程办公”“转正后”“设备补贴”“报销金额”这些关键语义召回。

初步判断:先拆开 RAG 链路

不要直接改系统提示词。先把 RAG 拆成五段:用户问题、问题向量、向量/关键词召回、上下文拼接、模型回答。只要能打印每段输入输出,就能知道偏差从哪里开始。

RAG 答非所问排查流程,从用户问题到向量化、召回片段、上下文拼接和生成回答
图 1:先把 RAG 链路拆开,确认错误是在检索前、检索中还是生成阶段出现。

一个最小排查日志应该包含这些字段:

{
  "question": "远程办公员工转正后,设备补贴能报销多少?",
  "top_k": 5,
  "hits": [
    {
      "score": 0.82,
      "source": "入职设备流程.md",
      "chunk_id": "doc-12-03",
      "text": "新员工入职后可领取电脑和显示器..."
    }
  ]
}

如果 top 结果里完全没有“转正”“补贴”“报销金额”,就先查检索,不要急着责怪模型。

动手验证:打印召回片段和分数

下面是一段简化的排查伪代码。重点不是具体向量库,而是把问题、分数、来源、片段内容都打印出来。

def debug_rag(question: str) -> None:
    query_vector = embed(question)
    hits = vector_store.search(query_vector, top_k=5)

    print("QUESTION:", question)
    for index, hit in enumerate(hits, start=1):
        print("RANK:", index)
        print("SCORE:", round(hit.score, 4))
        print("SOURCE:", hit.source)
        print("CHUNK:", hit.chunk_id)
        print("TEXT:", hit.text[:180].replace("\\n", " "))
        print("-" * 40)

跑完后先回答三个问题:

  • 正确文档有没有出现在 top-k 里?
  • 正确片段是否被切断,关键数字是否不在同一块里?
  • 错误片段的分数为什么更高,是词面匹配、语义相近,还是元数据过滤漏了?

定位原因:切块、向量和排序分别怎么看

切块过大:片段里噪声太多

如果一个片段同时包含入职、转正、离职、报销四个主题,向量会被多种语义混合。用户问补贴金额时,系统可能召回了这个大块,但上下文里有太多不相关内容,模型容易抓错重点。

切块过小:答案被拆散

如果“远程办公员工”和“报销金额 800 元”被切成两个片段,单个片段都不足以回答问题。此时要增加 overlap,或者按标题/表格行来切,保证条件和答案留在相邻上下文里。

只用向量:关键词数字容易丢

Embedding 适合语义相似,但金额、编号、日期、产品型号这类精确条件经常需要关键词或过滤条件配合。官方文档也强调,RAG 质量依赖内容准备、向量化、查询逻辑和相关性控制,很多场景会把向量检索与关键词检索结合。

只看分数:没有看片段是否可回答

高分片段不一定可回答问题。排查时不要只保存 score,还要保存 source、chunk_id、title、section 和原文。只有能定位来源,才知道该调切块还是调查询。

修复方案:让正确片段进入上下文

修复可以按从轻到重推进:

RAG 召回修复路径,从重切块、补元数据、混合检索、重排到固定问题集复查
图 2:修复目标不是让召回更多,而是让可回答问题的片段稳定进入上下文。

第一步:重切关键文档

制度、FAQ、接口文档、表格说明不要只按固定字数切。可以优先按标题、段落、列表项、表格行切,再设置适度 overlap,让条件和结论留在同一段或相邻段。

第二步:补充元数据

给每个 chunk 加上 sourcetitlesectionupdated_atdepartment 等字段。检索时可以用元数据过滤范围,回答时也能提供更清楚的引用来源。

第三步:增加混合检索

如果问题里有金额、日期、编号、专业术语,建议把关键词检索和向量检索合并,再做排序。这样“远程办公”“转正”“补贴”这些词不会完全依赖向量相似度。

第四步:控制上下文拼接

不要把 top-k 全部原样塞进 prompt。可以先去重、按来源聚合、保留标题和片段,再限制总 token。上下文里最好包含“片段来源 + 原文片段”,而不是只拼接正文。

验证结果:用固定问题集复查

修复后不要只试一个问题。准备一组固定问题,每个问题都记录期望命中的文档和关键片段:

[
  {
    "question": "远程办公员工转正后设备补贴能报销多少?",
    "expected_source": "远程办公与设备补贴制度.md",
    "must_include": ["转正后", "设备补贴", "800元"]
  },
  {
    "question": "试用期员工可以申请显示器吗?",
    "expected_source": "入职设备流程.md",
    "must_include": ["试用期", "显示器", "审批"]
  }
]

每次调切块、top-k、混合检索或重排规则,都跑同一组问题。只要正确片段稳定进入上下文,生成回答通常会明显收敛。

总结:一张排查清单

  • 先打印 top-k 召回片段,不先改 prompt。
  • 检查正确文档是否进入 top-k,正确答案是否被切断。
  • 对数字、日期、编号类问题加入关键词或过滤条件。
  • 给 chunk 补 source、title、section、updated_at 等元数据。
  • 上下文拼接时去重、保留来源、控制 token。
  • 用固定问题集验证修复前后变化。

RAG 答非所问时,真正要查的是“正确证据有没有被带到模型面前”。把切块、Embedding、召回、排序、上下文拼接逐段拆开,问题通常会比直接调提示词更快定位。

版本声明
本文转载于:17golang原创 如有侵犯,请联系study_golang@163.com删除
Spring Boot 参数校验工作流:DTO、注解和统一错误响应Spring Boot 参数校验工作流:DTO、注解和统一错误响应
上一篇
Spring Boot 参数校验工作流:DTO、注解和统一错误响应
PHP 文件上传生命周期:从表单校验到存储和过期清理
下一篇
PHP 文件上传生命周期:从表单校验到存储和过期清理
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    2476次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    2282次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    2230次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    2435次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    2406次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码