堆卡时代终结：AI算力基础设施迎来“系统重构”时刻

张

张建站

2026/5/23 6:33:00

10分钟阅读

作者 | 曾响铃文 | 响铃说2026年中国AI算力投资持续攀升。但背后有一个现实很扎心。在万卡集群里近一半算力其实在等数据不是在算。对此超聚变CEO刘宏云在5月20日的探索者大会上算了一笔账——同样的硬件经过调优后有效Token产出能差出40%到50%。换句话说你买的算力可能一半在空转。这不是某一家的问题。千亿参数大模型训练已成常态万卡乃至十万卡集群的规模竞赛正在跑行业却集体撞上了一堵看不见的“墙”——堆再多的卡算力效率也没法线性增长。时至今日算力竞争的逻辑正在翻转。过去迷信“造出更强的芯片”现在胜负手已然变成了“把更多芯片高效组织起来”。万卡至百万卡集群的建设说到底是场从“堆砌算力”到“组织算力”的工程革命。在这场大会上超聚变中央研究院总裁范瑞琦发布了面向万卡至百万卡集群的新一代算力基础设施参考架构——宏机柜方案。站在整个行业困局来看这不是一次常规产品迭代而是整个行业“从堆卡到组系统”的一个关键切片。为什么“堆卡”模式走到尽头砸了钱效率却上不来。根本原因不在技术bug而在传统算力架构的结构性缺陷。具体看有四堵“看不见的墙”。首先是通信墙。传统以太网Scale-Out是星型拓扑节点间通信得经交换机转发。集群从千卡扩到万卡参与同步的节点翻了十倍通信冲突却呈指数级膨胀。在这种情况下端到端延迟从微秒累积到了毫秒万卡级分布式训练中网络通信耗时占比更是达到30%-50%。但是带宽从不是问题拓扑结构才是。由此必须引入Scale-Up架构做芯片间百纳秒级的高速直连通信开销才能压下来。其次是散热墙与能耗墙。当AI芯片功耗突破1000W单机柜功率密度奔着100kW去了。传统风冷在30kW/柜以上基本失效液冷从“可选”变成“必选”。但散热不是单点问题它牵出一个更硬的骨头——供电。范瑞琦在发布中给了一组数据672颗GPU同时运转整机柜功耗130万瓦。如果沿用传统的48V/54V供电电流会飙到2400安培线缆粗到塞不进机柜。800V高压直流是唯一解。在今年“算电协同”首次写入政府工作报告HVDC、SST等高压供电架构面临刚性升级。也就意味着散热和供电不再是配角而是系统能不能转起来的硬约束。最后是工程墙。众所周知传统IDC是为通用服务器托管设计的——标准机架、风冷散热、分散供电、现场组装。但是AI训推要的是高密度、预集成、一体化的“算力工厂”。这就导致了现场组装、分散供应已经跟不上万卡集群的交付效率和稳定性要求。预集成、预验证的整机柜交付成了工程化刚需。这三堵墙指向同一个结论算力基础设施的“单品思维”已经走到尽头。这不是换个更快的芯片、加个更强的散热风扇能解决的问题而是需要从系统层面重新设计——从“堆更多卡”转向“把卡更好地组在一起”。2026走出了一条系统重构的“中国路径”超节点的出现正是对以上这一命题的回答。那什么是超节点它的本质是一场算力系统的“集装箱革命”。传统模式下每台服务器独立部署、现场组装就像海运时代的散货运输——效率低、成本高、标准化程度差。超节点则将数十至数百颗AI芯片、液冷系统、供电模组、高速互联在整机柜层面深度紧耦合形成一个预集成、预验证的算力单元。这就像集装箱标准化对海运业的改造——从散货船到集装箱船装卸效率提升了数十倍。具体到算力领域超节点将部署周期从“周级”压缩到“天级”将通信瓶颈从毫秒级压回纳秒级将供电和散热从“现场解决”变为“工厂预置”。从这个角度看超节点不是“更快的服务器”而是一个新的算力组织单元。它解决的不是单点性能问题而是大规模集群的系统效率问题。超聚变此次发布的宏机柜方案正是这一思路的工程化落地。具体的单个机柜容纳672颗GPU整机柜功耗130万瓦采用800V高压直流供电和全液冷散热支持448G至1T的光纤全互联。但比这些参数更值得关注的是背后的设计逻辑——所有组件围绕“系统效率最大化”而非“单点性能最大化”来定义。因此如果把超节点仅仅理解为硬件集成就错过了这场变革的另一半。算力本身不是目的Token才是。超聚变CEO刘宏云在演讲中把定位说得很直白做企业的“Token工厂”——把算力转化为可度量、可结算、可服务化的Token输出。他算过同样的硬件经过调优后有效Token产出可以相差40%-50%。换句话说算力到Token的转化效率才是客户真正关心的价值指标。这才是超聚变将其定位为“水平全栈解决方案提供者”的根本原因。新一代宏机柜方案作为底层基础设施向上需要对接数据AI平台和核心商业流程软件形成“算力-数据-应用”的完整闭环。对此超聚变算力事业部总裁唐启明在大会上阐释了这一逻辑“传统算力负载的尺子是Watt到FLOPS那不是客户价值的终点。今天我们重构了一条新的价值链面向智能体负载的新尺子——Token。Token Factory不是一台设备而是企业在AI时代新的生产力平台。”从这个视角看超聚变此次发布的意义就清晰了——它不是在做一次硬件升级而是在搭建从“底层算力”到“上层业务价值”的完整转化通道。在这里硬件是载体软件是引擎系统集成能力才是护城河。超节点开启算力价值的下一场全面战争2026年被行业视为国产超节点产业化放量的元年。很显然超聚变选择在这个节点发布正是要在技术路线未定、格局未分的窗口期抢占定义权。具体来看其底气来自两方面。一方面超聚变标准液冷服务器连续三年国内份额第一累计部署超10万节点液冷AI开放联盟已形成产业影响力。另一方面从芯片互联、供电方案到液冷散热、整机柜管理超聚变已经覆盖“算、电、热、网、管”全栈——这种端到端的工程能力决定了一家厂商能否真正交付可规模部署的超节点方案而非停留在PPT层面。到这里系统重构的方向已经明确超节点方案的技术可行性也已得到验证。但还有一个更根本的问题摆在面前——这条路靠一家厂商能走通吗答案是否定的。算力基础设施的系统重构本质上是一场产业链协同的工程革命而非某家公司的单点突破。超节点方案涉及芯片、网络、供电、散热、整机集成、软件平台等多个环节任何一个环节的短板都会成为整个系统的瓶颈。更重要的是这套方案要真正大规模落地还需要获得下游客户的规模化采购验证以及上游芯片厂商、中游ISV的生态支持。这正是超聚变选择“水平全栈”定位的深层逻辑——不碰行业垂直业务不试图通吃而是做“能力底座”让专业的人做专业的事。其“13N”生态战略1个硬件系统3层能力模型、AI Native调优、工具链N个垂类ISV伙伴回答的就是这个问题。简单来说超聚变做的是“标准化的通用底座”而上层的行业应用、垂类优化交给合作伙伴。但这里存在一个结构性的张力。一方面超节点方案为了追求极致性能天然倾向于“封闭优化”——芯片、互联、供电、散热高度耦合形成一个紧密集成的系统。另一方面生态的繁荣需要“开放标准”——让不同厂商的芯片、不同ISV的应用能够低成本接入。对此范瑞琦在发布会中明确表态“架构开放能力共享”并感谢了博通、盛科、云河等多家网络交换芯片厂商的支持。但“开放”与“性能”之间的平衡从来不是一句口号能解决的它需要在实际工程中反复取舍。更现实的压力来自价值链的重构。硬件厂商面临毛利率被芯片成本压缩的困境必须从“卖盒子”转向“卖系统”。芯片厂商则面临“被集成”的风险——如果超节点成为标准芯片会不会沦为看不到用户的标准化部件头部云厂商则有自研冲动试图“去中介化”将算力基础设施的控制权收归己有。那么在这场博弈中超节点方案要想真正成为主流必须让产业链上的每个角色都找到“为什么我要跟你玩”的理由而不是仅仅靠技术领先。从目前的信息来看超聚变在走一条“以开放换生态”的路。液冷AI开放联盟、宏机柜参考架构的开放设计、对多厂商芯片的支持都是在降低生态伙伴的接入门槛。但这条路能否走通最终要看一个朴素的商业逻辑——合作伙伴能否在这里赚到钱能否比自己做或跟别人合作赚得更多。写到最后从堆卡到组系统从拼参数到拼效率算力基础设施的系统重构已经开场。但是算力基础设施的终局从不是造出更快的超节点而是让千行百业的企业客户“像用电一样用算力”。2026年超聚变的这场发布只是起手式。接下来的工程化落地、生态构建、商业验证才是决定谁能留在牌桌上的硬仗。而这场硬仗的胜负或许要等到三五年后当第一批大规模部署的超节点集群交出真实的运营账单时才能见分晓了。*本文图片均来源于网络*此内容为【响铃说】原创未经授权任何人不得以任何方式使用包括转载、摘编、复制或建立镜像。#响铃说 Focusing on企业数字化与产业智能化升级这是关注一切与创业、产业和商业相关的降本增效新技术、新模式、新生态NO.520深度解读【完】曾响铃1钛媒体、人人都是产品经理等多家创投、科技网站年度十大作者2 虎啸奖评委长沙市委统战部旗下网络名人联盟成员3 作家【移动互联网新常态下的商业机会】等畅销书作者4 《中国经营报》《商界》《商界评论》《销售与市场》等近十家报刊、杂志特约评论员5 钛媒体、36kr、虎嗅、界面、澎湃新闻等近80家专栏作者6 “脑艺人”脑力手艺人概念提出者现演变为“自媒体”成为一个行业7 腾讯全媒派荣誉导师、功夫财经学者矩阵成员、多家科技智能公司传播顾问。

昇腾CANN opbase与算子生态协作：从单一算子到完整计算图

前言单个算子的性能再高，如果无法和其他算子高效协作，最终端到端的模型推理或训练性能也不会好。一个典型的深度学习模型包含几十到几百个算子，它们之间的数据流、内存分配、执行顺序都需要精心编排。opbase作为所有算子仓库的公共基础&…...

2026/5/23 6:32:01 阅读更多 →

Windows下Charles证书过期导致HTTPS抓包失败的彻底解决方案

1. 为什么Charles证书过期会让整个抓包流程突然“失明”你正调试一个关键接口，App在模拟器里跑得好好的，响应时间、Header字段、加密参数都一清二楚——直到某天早上打开Charles，发现所有HTTPS请求全变成红色叉号，状态栏写着“SSL…...

2026/5/23 6:26:02 阅读更多 →

手把手教你给STM32智能小车装上‘眼睛’：TSL1401线性CCD模块从接线到PID调参全流程

从零打造视觉导航智能小车：TSL1401线性CCD模块实战指南给智能小车装上"眼睛"是每个嵌入式开发者的梦想。当传统红外传感器还在为复杂赛道发愁时，线性CCD模块已经能像人眼一样捕捉连续的光强变化。本文将用STM32F103RCT6作为大脑，带…...

2026/5/23 6:25:01 阅读更多 →

Windows隐藏COM端口清理指南：解决端口号膨胀问题

1. 项目概述：为什么你的COM端口号会“膨胀”到两位数？如果你是一位长期在Windows系统下进行嵌入式开发、单片机调试，或者经常使用USB转串口工具的朋友，大概率遇到过这个令人头疼的现象：设备管理器里的COM端口号&#x…...

2026/5/22 18:23:15 阅读更多 →

Playnite完整指南：高效统一你的跨平台游戏库管理体验

Playnite完整指南：高效统一你的跨平台游戏库管理体验【免费下载链接】Playnite Video game library manager with support for wide range of 3rd party libraries and game emulation support, providing one unified interface for your games. 项目地址: http…...

2026/5/22 12:36:59 阅读更多 →