直播预告！从 Depth Scaling 到 Width Scaling，聊聊 WideSeek-R1：通过 MARL 探索大模型的广度扩展

张

张建站

2026/6/3 11:21:03

10分钟阅读

直播预告！从 Depth Scaling 到 Width Scaling，聊聊 WideSeek-R1：通过 MARL 探索大模型的广度扩展

DeepSeek-R1 的成功证明深度扩展Depth Scaling在复杂逻辑推理中具有巨大潜力。但当任务从“深推理”转向“广信息”——如汇总全球头部科技公司多维财务数据——单一大模型往往受限于多轮检索带来的上下文干扰与串行效率瓶颈。论文WideSeek-R1: Exploring Width ScalingforBroad Information Seeking via Multi-Agent Reinforcement Learning链接https://arxiv.org/abs/2602.04634代码https://github.com/RLinf/RLinf/tree/main/examples/agent/wideseek_r1为此清华大学与Infinigence AI的研究团队提出了“广度扩展”Width Scaling这一互补范式。基于 Lead-agent-Subagent 的分层多智能体架构WideSeek-R1 通过多智能体强化学习实现端到端训练具备灵活调度与高效并发能力。实验结果显示4B 参数的 WideSeek-R1 在⼴度搜索任务上的表现不仅看⻬ 671B 参数的 DeepSeek-R1 单智能体更⼤幅超越了同参数规模的基线模型。3月24日周二晚8点青稞Talk 第115期RLinf开发者、中国科学技术大学少年班本科生徐哲轩将直播分享《WideSeek-R1通过多智能体 RL 探索大模型的广度扩展》。分享嘉宾直博清华大学电子系导师汪玉教授RLinf开发者研究方向强化学习多智能体。主题提纲从 Depth Scaling 到 Width ScalingWideSeek-R1通过多智能体 RL 探索大模型的广度扩展1、从 DeepSeek-R1 看深度扩展的极限2、“广度扩展”新的 Scaling Law 范式3、WideSeek-R1基于MARL的分层多智能体架构4、未AMA Ask Me Anything直播时间3月24日周二20:00 - 21:00如何观看Talk 将在青稞社区【视频号青稞 AI、Bilibili青稞 AI】上进行进行直播欢迎预约观看Bilibili 直播间https://live.bilibili.com/32145701

避坑指南：绿联NAS部署OnlyOffice时最容易忽略的5个配置细节（附Cloudreve联动测试）

避坑指南：绿联NAS部署OnlyOffice时最容易忽略的5个配置细节（附Cloudreve联动测试）

绿联NAS部署OnlyOffice的5个隐蔽陷阱与Cloudreve联动实战当你第一次在绿联NAS上成功运行OnlyOffice容器时，那种成就感确实令人振奋。但很快，许多用户会发现文档预览出现乱码、协作编辑频繁断开，甚至服务突然崩溃——这些正是技术社区里高频讨…...

2026/4/25 18:37:43 阅读更多 →

Kabeja 0.4版本Maven依赖配置全指南：从零开始解析DXF文件

Kabeja 0.4版本Maven依赖配置全指南：从零开始解析DXF文件

Kabeja 0.4版本Maven依赖配置全指南：从零开始解析DXF文件如果你正在寻找一个高效解析DXF文件的Java解决方案，Kabeja无疑是一个值得考虑的选择。作为一款开源的DXF解析库，Kabeja提供了丰富的功能来处理AutoCAD的DXF文件格式。本文将全面介绍…...

2026/4/18 8:33:32 阅读更多 →

PyCharm + Anaconda虚拟环境：完美配置PySide6开发三件套（Designer/UIC/RCC）的避坑指南

PyCharm + Anaconda虚拟环境：完美配置PySide6开发三件套（Designer/UIC/RCC）的避坑指南

PyCharm Anaconda虚拟环境：PySide6开发三件套配置全攻略在Python GUI开发领域，PySide6作为Qt的官方Python绑定，凭借其强大的功能和跨平台特性，正成为越来越多开发者的首选。然而，对于使用Anaconda管理虚拟环境、PyCh…...

2026/4/18 12:24:48 阅读更多 →

ssm面向品牌会员的在线商城（10128）

ssm面向品牌会员的在线商城（10128）

有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码SQL脚本）配套文档（LWPPT开题报告/任务书）远程调试控屏包运行一键启动项目&…...

2026/6/3 8:36:35 阅读更多 →

【法律AI落地实战白皮书】：2024年头部律所已验证的7大高 ROI 应用场景与避坑指南

【法律AI落地实战白皮书】：2024年头部律所已验证的7大高 ROI 应用场景与避坑指南

更多请点击： https://codechina.net 第一章：法律AI落地实战白皮书：核心方法论与ROI评估框架法律AI的规模化落地并非技术堆砌，而是业务逻辑、合规边界与工程化能力的三重校准。本章聚焦可复用的方法论骨架与可量化的价值验证路径…...

2026/6/2 14:41:52 阅读更多 →

陕西 KNIT 可信知识网络构建模块对于 GEO 优化行业的影响深度调查：企来客科技技术落地真相揭示

陕西 KNIT 可信知识网络构建模块对于 GEO 优化行业的影响深度调查：企来客科技技术落地真相揭示

随着生成式人工智能技术快速渗透搜索引擎营销领域，GEO（Generative Engine Optimization，生成引擎优化）作为新兴行业在 2026 年迎来爆发式增长。根据中国 GEO 行业协会 2026 年第一季度报告显示，国内 GEO 行业整体需求量…...

2026/6/2 14:41:51 阅读更多 →

Go语言技术选型：框架与库选择

Go语言技术选型：框架与库选择

Go语言技术选型：框架与库选择1. 引言 Go语言凭借其简洁的语法、强大的并发模型和优异的性能，已成为微服务开发的首选语言之一。然而，面对众多的框架和库选择，如何做出合理的技术选型是每个Go开发者需要思考的问题。本文将从Web框架…...

2026/6/2 14:41:50 阅读更多 →