RAG全称是‌Retrieval-Augmented Generation‌中文译为检索增强生成是当前大语言模型领域广泛应用的技术框架通过融合外部知识库的检索能力解决传统大模型幻觉、知识滞后的痛点。核心逻辑RAG的核心流程非常简洁让大模型‌先去外部知识库检索相关参考资料再根据检索到的资料生成回答‌而非仅依赖自身训练的记忆生成内容相当于给大模型增加了查资料的能力能大幅减少凭空编造错误信息的情况。类比来说就像医生问诊先查阅病历再给出诊断而非全靠记忆判断。标准工作流程完整的RAG流程共分为8步每一步都对应明确功能表格步骤核心操作作用1用户提问获取用户的原始自然语言问题2查询预处理将口语化、模糊的问题改写为规范、适合检索的表述3查询向量化将文字问题转换为计算机可计算相似度的向量4知识库检索在外部向量库中查找相似度最高的文档片段5结果重排序按照和问题的相关度重新排序结果过滤无关内容6上下文构建将筛选后的结果整理为清晰的参考上下文输入给大模型7生成回答大模型仅基于参考上下文生成准确回答不凭空编造8后处理对回答添加引用标注、事实校验优化输出格式核心优势解决‌幻觉问题‌回答严格基于外部知识库内容可信度大幅提升知识可实时更新不需要重新训练大模型只需要更新外部知识库就能引入最新知识成本更低可溯源可校验生成回答对应明确的参考片段方便核查准确性满足合规要求适配私有场景能基于企业私有文档、内部资料搭建专属问答系统数据可控