多 Agent 只是解决复杂问题的手段而不是目的。实现业务价值覆盖工程成本才是架构设计的终极目标。一、场景决策非必要不上智能体能用提示词工程搞定的绝不上智能体不行再加工具只有当单体能力触及天花板且业务价值足以覆盖增加的成本和延迟时才采用多智能体架构。识别黄金场景MAS 仅适用于长链路复杂 SOP、需要多视角验证、复杂工具调度、以及需要大规模并行搜索或上下文隔离保护的场景。二、架构硬化三层分离架构将系统分为调度层、执行层、推理层实现职责清晰、边界明确。物理解耦将模型推理与沙箱环境物理分离。沙箱应采用容器技术如 Docker实现全隔离可随时销毁。权限物理拦截在系统中间件实现工具访问控制TAC而非仅靠 Prompt 约束。如果智能体尝试越权系统层应直接物理拦截。三、流程锁定按上下文边界拆分不要按工作类型开发、测试拆分任务而应按上下文边界拆分。例如负责功能的智能体也应负责其测试因为拆分高度耦合的任务会导致严重的“传声筒效应”和信息损耗。拓扑锁定放弃不可控的纯对话驱动改用图状态机如 LangGraph预设确定的路由实现“化死条件路由”强制任务按 SOP 路径流转严防死循环。选择合适的模式顺序流用于明确的步骤依赖。并行流用于扩大搜索空间如多路市场研究。评估-优化流用于对产出质量要求极高的场景。四、状态治理状态外置持久化严禁将任务进度存在模型内存里。应将任务清单、经验日志记录踩过的坑和成果快照Git Commit物理存入硬盘。全新上下文滚动RALPH Loop每一轮任务开始前清空全量对话历史开启一个全新的上下文窗口仅从硬盘重载 State JSON。这能实现“大脑清洗”确保智能体始终清醒且无历史冗余信息的干扰。五、质量保证引入确定性的外部判据验证不能全靠 LLM 互粉。必须接入代码编译器、Linter 或单元测试生成器。只有工具返回 Success 信号才判定验证通过。任务微型化与硬验收标准将大需求拆解为单次循环可完成的 User Story并固化验收标准如响应延迟 ≤ 200ms。验收标准写得越死越好防止模型偷懒或画饼。红蓝对抗机制引入功能对立的角色如激进派 vs 保守派让对抗派专门找茬最后由具有本体论约束的大法官裁决以此压制模型的幻觉。