在人工智能和大语言模型(LLM)的语境下,RAG、知识库和上下文是构建智能问答系统的三个核心概念。
它们的目的都是为了让 AI 获取外部信息,但各自的角色、范围和工作阶段有所不同。
核心概念定义
1. 知识库(Knowledge Base)
- 本质:结构化信息管理系统,核心目标是知识的存储和检索
- 形态:可以是结构化图谱/规则引擎,也可以是非结构化文档
- 特点:静态存储系统,需要定期更新维护
2. RAG(Retrieval-Augmented Generation)
- 本质:检索增强生成技术框架
- 核心思想:让大模型在回答问题时,先从外部知识库中检索相关内容,再基于检索结果生成回答
- 组成:由离线索引流水线(文档预处理存入向量库)和在线查询流水线(接收问题、检索、生成)组成
3. 上下文(Context)
- 本质:当前对话或任务中传递给模型的文本信息
- 特点:动态的、临时的信息载体
- 作用:保障多轮对话连贯性,提供任务背景信息
主要区别
| 特性 |
知识库 |
RAG |
上下文 |
| 角色 |
数据存储系统 |
检索+生成技术 |
信息传递载体 |
| 数据来源 |
预先存储的文档/数据 |
外部知识库 |
当前对话或检索结果 |
| 实时性 |
需要定期更新 |
支持实时检索 |
实时动态变化 |
| 计算复杂度 |
存储和索引 |
检索+生成(线性) |
自注意力机制(O(n²)) |
| 成本效率 |
存储成本 |
低(仅处理相关内容) |
高(长上下文消耗算力) |
核心联系
1. 工作流程上的联系
知识库 → RAG检索 → 上下文拼接 → 模型生成
- 知识库为RAG提供数据源
- RAG从知识库中检索相关信息
- 检索结果被拼接成上下文传递给模型
- 上下文包含检索到的知识,用于指导模型生成
2. 功能互补
- 知识库解决"知识从哪里来"的问题
- RAG解决"如何找到相关知识"的问题
- 上下文解决"如何将知识传递给模型"的问题
3. 实际应用场景
当用户提问时:
- RAG引擎从知识库中检索相关文档
- 将检索到的文档内容作为上下文的一部分
- 模型基于这个增强的上下文生成准确回答
总结
区别:
- 知识库是 存储层,信息的仓库(数据存储)
- RAG是 检索层,搬运信息的过程(技术架构)
- 上下文是 传递层,是 AI 最终读到的书本(实时内存)
联系:
三者构成一个完整的知识增强系统:知识库存储知识,RAG检索知识,上下文传递知识,共同解决大模型的知识截止和幻觉问题。
