大模型RAG检索增强生成

有勇气的牛排 703 AI大模型 2025-04-20 13:54:49

1 摘要

在大模型（如ChatGPT、LLMs）中，RAG是Retrieval-Augmented Genration（检索增强生成）的缩写，它是一种结合了信息检索和生成式模型的技术，用于提升语言模型在问答、知识生成等任务中的表现。

2 RAG的基本原理

RAG模型通常包括两个阶段

2.1 Retrieval 检索阶段

当用户提出一个问题，模型会先使用一个检索器（通常是基于向量的语义检索）去一个外部知识库中寻找与问题相关的文档、段落或片段。

检索器常用的技术包括：

向量库：Elasticseach、Milvus、DashVector 等
嵌入模型（如OpenAI Embeddings）将文本转为向量，以便计算相似度。

2.2 Augmented Generation 增强生成阶段

将上一步检索到的内容和原始问题一起输入到提示词中，让模型在上下文中融合检索到的信息进行回答。
模型不再依赖“记忆”的知识，而是利用“查找”的知识，这样可以避免过时、幻觉（hullucination）等问题。

3 RAG 的优势

优点	描述
✅ 更加准确	使用真实的数据来源，减少模型“瞎编”的可能
📚 知识可更新	不需要重新训练模型，只需要更新知识库即可
🔒可控性更强	可以限制模型只用某些可靠来源的信息
💡可解释性强	用户可以看到参考了哪些文档

4 RAG 的典型应用

智能客服系统（结合企业文档知识库）
企业内部问答系统（基于私有知识库）
法律、医疗、科研问答
文档总结与内容分析
AI搜索引擎

<h2><a id="1__0"></a>1 摘要</h2> <p>在大模型（如ChatGPT、LLMs）中，RAG是Retrieval-Augmented Genration（检索增强生成）的缩写，它是一种结合了<strong>信息检索</strong>和<strong>生成式模型</strong>的技术，用于提升语言模型在问答、知识生成等任务中的表现。</p> <h2><a id="2_RAG_4"></a>2 RAG的基本原理</h2> <p>RAG模型通常包括两个阶段</p> <h3><a id="21_Retrieval__8"></a>2.1 Retrieval 检索阶段</h3> <p>当用户提出一个问题，模型会先使用一个检索器（通常是基于向量的语义检索）去一个外部知识库中寻找与问题相关的文档、段落或片段。</p> <p>检索器常用的技术包括：</p> <ul> <li>向量库：Elasticseach、Milvus、DashVector 等</li> <li>嵌入模型（如OpenAI Embeddings）将文本转为向量，以便计算相似度。</li> </ul> <h3><a id="22_Augmented_Generation__17"></a>2.2 Augmented Generation 增强生成阶段</h3> <ul> <li>将上一步检索到的内容和原始问题一起输入到提示词中，让模型在上下文中<strong>融合检索到的信息进行回答</strong>。</li> <li>模型不再依赖“记忆”的知识，而是利用“查找”的知识，这样可以避免过时、幻觉（hullucination）等问题。</li> </ul> <h2><a id="3_RAG__24"></a>3 RAG 的优势</h2> <table> <thead> <tr> <th>优点</th> <th>描述</th> </tr> </thead> <tbody> <tr> <td>✅ 更加准确</td> <td>使用真实的数据来源，减少模型“瞎编”的可能</td> </tr> <tr> <td>📚 知识可更新</td> <td>不需要重新训练模型，只需要更新知识库即可</td> </tr> <tr> <td>🔒可控性更强</td> <td>可以限制模型只用某些可靠来源的信息</td> </tr> <tr> <td>💡可解释性强</td> <td>用户可以看到参考了哪些文档</td> </tr> </tbody> </table> <h2><a id="4_RAG__33"></a>4 RAG 的典型应用</h2> <ul> <li>智能客服系统（结合企业文档知识库）</li> <li>企业内部问答系统（基于私有知识库）</li> <li>法律、医疗、科研问答</li> <li>文档总结与内容分析</li> <li>AI搜索引擎</li> </ul>