RAG 检索增强

RAG 通过在生成前检索相关文档，将外部知识注入到 Prompt 中，使模型能够基于最新、准确的信息生成回答。这解决了模型知识截止日期和幻觉问题，是企业级 AI 应用的标准架构。

高级架构设计

适用场景

需要基于特定文档回答时；信息需要实时更新时；减少模型幻觉时；构建企业知识库问答系统时。

Prompt 示例

基于以下检索到的文档片段回答用户问题。如果文档中没有相关信息，明确说明「根据现有资料无法回答」。

## 检索结果
[文档1] 公司年假政策：入职满1年享有5天年假，满3年享有10天，满5年享有15天。
[文档2] 请假流程：需提前3个工作日在OA系统提交申请，直属上级审批。

## 用户问题
我入职2年了，有多少天年假？怎么请假？

输出示例

根据公司政策：

1. 年假天数：您入职满1年但未满3年，享有 5 天年假。
2. 请假流程：需提前 3 个工作日在 OA 系统提交申请，由直属上级审批。

（以上信息来源于公司年假政策和请假流程文档）

最佳实践

检索结果要标注来源，便于溯源
限制检索片段数量（3-5 个最相关的）
指示模型区分「文档中的信息」和「自身知识」
设计 fallback 策略处理检索结果为空的情况

常见坑

检索质量直接决定生成质量
无关文档会干扰模型判断
文档片段之间可能存在矛盾信息
过多检索结果会超出上下文窗口