FastGPT 是由Sealos 团队开发的开源 AI 知识库问答系统基于LLM RAG检索增强生成架构支持私有化部署。它提供了可视化的数据预处理、工作流编排、应用发布与权限管理能力让非技术人员也能快速搭建精准、可控的 AI 助手。GitHub 地址labring/FastGPT官方文档https://doc.fastgpt.in/FastGPT 的强大源于它将经典 RAG 管线拆解为可编排的模块并融合了数据预处理、混合检索和高级对话管理等能力。1. 经典 RAG 基础首先FastGPT 遵循标准的 RAG 流程文档向量化将上传的私有文档PDF、Word、Markdown 等按段落切分通过嵌入模型如 OpenAI text-embedding-3-large转换为向量存入向量数据库PostgreSQL pgvector 或 Milvus。语义检索用户提问时将问题向量化从库中召回语义最相近的文档片段。上下文增强生成将召回的片段与用户问题、系统提示词一同送入 LLM生成最终答案。2. 混合检索与重排序为提升检索精度FastGPT 支持混合检索同时进行向量语义检索与传统的 BM25 关键词检索并结合重排序模型Re-rank对多路召回结果做精细排序大幅减少无关片段对答案的干扰。3. 高级编排工作流Flow引擎这是 FastGPT 区别于普通“文档问答”工具的核心设计。通过可视化拖拽节点可以自定义整个问答流程意图分类节点自动判断用户是想查询知识库、调用 API还是闲聊。知识库搜索节点指定调用哪个知识库、检索条数、相似度阈值等。LLM 回答节点针对不同意图使用不同模型、提示词和温度参数。插件节点调用 HTTP 请求、执行代码、查询数据库等实现联网搜索、企业系统打通。变量与条件分支收集用户输入如订单号、依据条件走不同分支实现多轮对话表单填写。这套引擎让 FastGPT 不仅能做问答还能编排成客服工单机器人、面试模拟器、合同审查助手等复杂应用。4. 多模态与数据切分FastGPT 可处理图文混排文档通过 OCR 或视觉模型解析图片中的文字。其数据切分支持自定义分隔符、层级段落、自动 QA 拆分甚至能直接将文档按“问题-答案对”整理显著提升检索回答的还原度。快速上手FastGPT 提供了两种部署方式Sealos 云服务一键部署与Docker 本地部署。以下以本地 Docker 部署为例简述核心使用流程。环境准备确保安装 Docker 和 docker-compose然后下载 FastGPT 官方部署文件bashmkdir fastgpt cd fastgpt curl -O https://raw.githubusercontent.com/labring/FastGPT/main/deploy/docker/docker-compose.yml按需配置好 LLM 的 API Key支持 OpenAI、国内大模型等启动服务bashdocker-compose up -d访问http://localhost:3000即可进入管理界面默认账号 root密码 123456请及时修改。1. 创建知识库并导入文档进入“知识库”模块点击“新建”输入名称和向量模型。然后上传你的文档支持 txt, pdf, md, docx, csv 等FastGPT 会自动进入数据处理流水线自动分段智能识别标题层级在语义边界处分割。QA 拆分可选自动或手动将长文档拆解为“问-答对”更适合客服场景。图片处理自动提取图片并转为可搜索的文本描述。处理完成后知识库状态变为“就绪”即可被应用调用。2. 配置 AI 应用进入“应用”模块新建一个应用。你可以选择简单模式快速启动也可以进入高级编排自由设计工作流。简单模式下关联刚才创建的知识库。设置系统提示词如“你是一个专业的客服请根据以下知识库内容友善回答用户”。调整温度、上下文长度、检索相似度等参数。保存并预览即可立即对话测试。3. 发布与集成应用调试满意后可以发布为独立对话页生成一个可分享的链接他人无需登录即可使用。嵌入网站复制一段 HTML 代码以悬浮球形式嵌入官网。通过 API 调用FastGPT 暴露了完整的 RESTful API支持与企业微信、钉钉、飞书等第三方系统集成。设置权限和知识库引用支持用户注册登录、为不同团队分配独立应用保护数据隔离。