有勇气的牛排博客

大模型RAG检索增强生成

有勇气的牛排 62 AI大模型 2025-04-20 13:54:49

1 摘要

在大模型(如ChatGPT、LLMs)中,RAG是Retrieval-Augmented Genration(检索增强生成)的缩写,它是一种结合了信息检索生成式模型的技术,用于提升语言模型在问答、知识生成等任务中的表现。

2 RAG的基本原理

RAG模型通常包括两个阶段

2.1 Retrieval 检索阶段

当用户提出一个问题,模型会先使用一个检索器(通常是基于向量的语义检索)去一个外部知识库中寻找与问题相关的文档、段落或片段。

检索器常用的技术包括:

  • 向量库:Elasticseach、Milvus、DashVector 等
  • 嵌入模型(如OpenAI Embeddings)将文本转为向量,以便计算相似度。

2.2 Augmented Generation 增强生成阶段

  • 将上一步检索到的内容和原始问题一起输入到提示词中,让模型在上下文中融合检索到的信息进行回答
  • 模型不再依赖“记忆”的知识,而是利用“查找”的知识,这样可以避免过时、幻觉(hullucination)等问题。

3 RAG 的优势

优点 描述
✅ 更加准确 使用真实的数据来源,减少模型“瞎编”的可能
📚 知识可更新 不需要重新训练模型,只需要更新知识库即可
🔒可控性更强 可以限制模型只用某些可靠来源的信息
💡可解释性强 用户可以看到参考了哪些文档

4 RAG 的典型应用

  • 智能客服系统(结合企业文档知识库)
  • 企业内部问答系统(基于私有知识库)
  • 法律、医疗、科研问答
  • 文档总结与内容分析
  • AI搜索引擎

留言

专栏
文章
加入群聊