大模型RAG检索增强生成
有勇气的牛排
62
AI大模型
2025-04-20 13:54:49
1 摘要
在大模型(如ChatGPT、LLMs)中,RAG是Retrieval-Augmented Genration(检索增强生成)的缩写,它是一种结合了信息检索和生成式模型的技术,用于提升语言模型在问答、知识生成等任务中的表现。
2 RAG的基本原理
RAG模型通常包括两个阶段
2.1 Retrieval 检索阶段
当用户提出一个问题,模型会先使用一个检索器(通常是基于向量的语义检索)去一个外部知识库中寻找与问题相关的文档、段落或片段。
检索器常用的技术包括:
- 向量库:Elasticseach、Milvus、DashVector 等
- 嵌入模型(如OpenAI Embeddings)将文本转为向量,以便计算相似度。
2.2 Augmented Generation 增强生成阶段
- 将上一步检索到的内容和原始问题一起输入到提示词中,让模型在上下文中融合检索到的信息进行回答。
- 模型不再依赖“记忆”的知识,而是利用“查找”的知识,这样可以避免过时、幻觉(hullucination)等问题。
3 RAG 的优势
优点 |
描述 |
✅ 更加准确 |
使用真实的数据来源,减少模型“瞎编”的可能 |
📚 知识可更新 |
不需要重新训练模型,只需要更新知识库即可 |
🔒可控性更强 |
可以限制模型只用某些可靠来源的信息 |
💡可解释性强 |
用户可以看到参考了哪些文档 |
4 RAG 的典型应用
- 智能客服系统(结合企业文档知识库)
- 企业内部问答系统(基于私有知识库)
- 法律、医疗、科研问答
- 文档总结与内容分析
- AI搜索引擎
<h2><a id="1__0"></a>1 摘要</h2>
<p>在大模型(如ChatGPT、LLMs)中,RAG是Retrieval-Augmented Genration(检索增强生成)的缩写,它是一种结合了<strong>信息检索</strong>和<strong>生成式模型</strong>的技术,用于提升语言模型在问答、知识生成等任务中的表现。</p>
<h2><a id="2_RAG_4"></a>2 RAG的基本原理</h2>
<p>RAG模型通常包括两个阶段</p>
<h3><a id="21_Retrieval__8"></a>2.1 Retrieval 检索阶段</h3>
<p>当用户提出一个问题,模型会先使用一个检索器(通常是基于向量的语义检索)去一个外部知识库中寻找与问题相关的文档、段落或片段。</p>
<p>检索器常用的技术包括:</p>
<ul>
<li>向量库:Elasticseach、Milvus、DashVector 等</li>
<li>嵌入模型(如OpenAI Embeddings)将文本转为向量,以便计算相似度。</li>
</ul>
<h3><a id="22_Augmented_Generation__17"></a>2.2 Augmented Generation 增强生成阶段</h3>
<ul>
<li>将上一步检索到的内容和原始问题一起输入到提示词中,让模型在上下文中<strong>融合检索到的信息进行回答</strong>。</li>
<li>模型不再依赖“记忆”的知识,而是利用“查找”的知识,这样可以避免过时、幻觉(hullucination)等问题。</li>
</ul>
<h2><a id="3_RAG__24"></a>3 RAG 的优势</h2>
<table>
<thead>
<tr>
<th>优点</th>
<th>描述</th>
</tr>
</thead>
<tbody>
<tr>
<td>✅ 更加准确</td>
<td>使用真实的数据来源,减少模型“瞎编”的可能</td>
</tr>
<tr>
<td>📚 知识可更新</td>
<td>不需要重新训练模型,只需要更新知识库即可</td>
</tr>
<tr>
<td>🔒可控性更强</td>
<td>可以限制模型只用某些可靠来源的信息</td>
</tr>
<tr>
<td>💡可解释性强</td>
<td>用户可以看到参考了哪些文档</td>
</tr>
</tbody>
</table>
<h2><a id="4_RAG__33"></a>4 RAG 的典型应用</h2>
<ul>
<li>智能客服系统(结合企业文档知识库)</li>
<li>企业内部问答系统(基于私有知识库)</li>
<li>法律、医疗、科研问答</li>
<li>文档总结与内容分析</li>
<li>AI搜索引擎</li>
</ul>
留言