RAG 检索增强
RAG 通过在生成前检索相关文档,将外部知识注入到 Prompt 中,使模型能够基于最新、准确的信息生成回答。这解决了模型知识截止日期和幻觉问题,是企业级 AI 应用的标准架构。
高级 架构设计
适用场景
需要基于特定文档回答时;信息需要实时更新时;减少模型幻觉时;构建企业知识库问答系统时。
Prompt 示例
基于以下检索到的文档片段回答用户问题。如果文档中没有相关信息,明确说明「根据现有资料无法回答」。 ## 检索结果 [文档1] 公司年假政策:入职满1年享有5天年假,满3年享有10天,满5年享有15天。 [文档2] 请假流程:需提前3个工作日在OA系统提交申请,直属上级审批。 ## 用户问题 我入职2年了,有多少天年假?怎么请假?
输出示例
根据公司政策: 1. 年假天数:您入职满1年但未满3年,享有 5 天年假。 2. 请假流程:需提前 3 个工作日在 OA 系统提交申请,由直属上级审批。 (以上信息来源于公司年假政策和请假流程文档)
最佳实践
- 检索结果要标注来源,便于溯源
- 限制检索片段数量(3-5 个最相关的)
- 指示模型区分「文档中的信息」和「自身知识」
- 设计 fallback 策略处理检索结果为空的情况
常见坑
- 检索质量直接决定生成质量
- 无关文档会干扰模型判断
- 文档片段之间可能存在矛盾信息
- 过多检索结果会超出上下文窗口