RAG 是什么检索增强生成给大模型「开卷考试」让它的回答基于真实文档工作流程分索引阶段离线建库和查询阶段在线检索生成微调 vs RAG微调是「内化知识」RAG 是「外挂参考书」两者互补文档切割从固定大小到语义切割推荐先用递归字符切割起步Re-rank用 Cross-Encoder 对检索结果做精排准确率提升 30-50%Embedding从 Word2Vec 到 BERT 再到 BGE-M3技术不断演进向量数据库Milvus、Pinecone、Weaviate 等各有侧重按需选型多路召回向量检索 BM25 混合检索效果比单路好 10-30%效果量化用 RAGAS 等框架评估 Faithfulness、Relevance 等核心指标大模型幻觉RAG 是降低幻觉的核心手段但不能完全消除需要组合策略