RAG
# RAG介绍
RAG 检索增强生成(Retrieval Augmented Generation),已经成为当下最火热的LLM应用方案和打开方式了。
简单的说: RAG(检索增强生成) = 检索技术 + LLM 提示。
# RAG架构
完整的RAG应用流程主要包含两个阶段:
- 数据准备阶段:数据提取——>文本分割——>向量化(embedding)——>数据入库
- 应用阶段:用户提问——>数据检索(召回)——>注入Prompt——>LLM生成答案
┌────────────────────────────────────────────────────────────┐
│ RAG 流程 │
├────────────────────────────────────────────────────────────┤
│ │
│ 1. 索引阶段(离线) │
│ 文档 → 分块 → Embedding → 存入向量库 │
│ │
│ 2. 检索阶段 │
│ 用户问题 → Embedding → 向量库搜索 → 相关文档片段 │
│ │
│ 3. 注入 Prompt 阶段 ⭐ │
│ 将检索结果 + 用户问题 → 组装成完整 Prompt │
│ │
│ 4. 生成阶段 │
│ 完整 Prompt → LLM → 生成回答 │
│ │
└────────────────────────────────────────────────────────────┘
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 参考文档
上次更新: 2026/01/14, 22:09:59