OrgAgent:像公司一样组织你的多智能体系统
摘要虽然基于大语言模型的多智能体系统在复杂推理方面展现出强大潜力但如何有效组织多个智能体仍是一个未解的问题。本文提出了OrgAgent——一种公司式层级多智能体框架将协作划分为治理层、执行层和合规层。OrgAgent将多智能体推理分解为三个层级治理层负责规划与资源分配执行层负责任务求解与审查合规层负责最终答案的控制。通过在推理任务、大语言模型、执行模式和执行策略等多个维度上对该框架进行评估我们发现采用公司式层级组织的多智能体系统通常优于其他组织结构。此外在大多数设定下层级化协作相较于扁平化协作还能降低令牌消耗。例如在SQuAD 2.0数据集上GPT-OSS-120B模型在层级化设定下的性能比扁平化多智能体系统提升了102.73%同时令牌使用量减少了74.52%。进一步分析表明当任务能够从稳定的技能分配、受控的信息流和分层验证中获益时层级结构的作用最为显著。总体而言我们的研究结果凸显了组织结构作为多智能体推理中一个重要因素的价值它不仅影响效能和成本也影响协作行为。1 引言大语言模型已从单轮对话助手演变为具备规划、工具使用和协作能力的日益自主的智能体。这些进展推动了基于大语言模型的多智能体系统的发展该系统在问题求解、软件工程和仿真等复杂场景中得到了越来越多的研究Guo 等2024Li 等2024He 等2025。现有研究沿着两个方向展开。一条方向研究智能体之间的交互机制聚焦于智能体如何通过角色扮演、讨论、辩论、投票或共识等方式进行通信与协作以CAMELLi 等2023为代表。另一条方向则关注更高层级的组织强调角色分配、工作流设计和系统级协调以AutoGenWu 等2024等框架以及MetaGPTHong 等2023、ChatDevQian 等2024和Paperclippaperclipai2026等角色专业化协作系统为代表。组织多智能体系统的一种自然方式是通过组织结构Pugh1971Mintzberg1979Daft2007。在组织理论中组织结构决定了任务、协调、监督和决策权如何分配从而塑造组织行为Burton 等2012。常见的形式包括管理层级较少的扁平结构Ghiselli 和 Siegel1972和管理层级更为复杂的层级结构Child2019。其中公司式层级经过数十年的演变已形成了完善的目标对齐、角色划分、资源分配和结果验证机制Mintzberg1979Burton 等2012。这使得公司式层级成为组织多智能体系统的自然基础因为它明确定义了谁负责规划、谁负责执行、谁负责审查以及决策如何被控制。在本工作中如图1所示我们将组织结构实例化为公司式层级——这是现实世界中最常见的组织结构之一——以研究结构化治理如何影响多智能体推理。OrgAgent将推理过程分解为三个层级1治理层负责规划、路由和资源分配2执行层负责答案生成、批判和修订其交互过程进一步通过不同的执行模式和执行策略进行控制3合规层负责最终答案验证和输出控制。随后我们在三个推理基准测试MuSR、MuSiQue 和 SQuAD 2.0上使用三种语言模型以及多种执行模式和执行策略对该框架进行了评估。结果表明以公司式层级组织的多智能体系统总体上优于扁平化多智能体基线以及单智能体基线尤其在 MuSiQue 和 SQuAD 2.0 上表现更为突出。