上一篇我们刚刚讲完,LangChain进入进阶阶段之后真正需要补充的不是更多的API而是:多轮上下文如何管理Retriever是如何组织的模块边界怎样划分哪些地方不应该过分设计但是当你把这些东西都搭起来之后,马上就会有一个更现实的问题出现:为什么系统架子搭好了之后,回答的效果还是不稳定?这是很多人做知识库问答时最容易陷入的状态:链路可以运行检索也取得了结果Prompt也写了模型也用到了前端也可以展示答案一切都很完美。但是当真正的问题出现的时候,问题就暴露出来了:有时候明明已经把相关的文档叫回来了,答案还是答偏了有时候回答是正确的,但是引用的依据错了有时候第一轮还可以,换个问法就突然不稳了有时候一个简单的问题,模型却说得又长又虚此时大多数人的第一反应就是:模型不强向量库不好Embedding不够高级当然会有些影响,但是大多数项目早期的情况是:RAG没有做到,每一层都差一点点最后累积起来就成了“总是差最后一公里”。本文将继续沿着企业制度知识库问答这条主线,进行一次实战排障式的拆解。不再只讲“RAG有哪些组件”,而是直接回答一个更实际的问题: