DeepSeek 在 2026 年 4 月开源了 TileKernels——用 TileLang DSL 编写的 GPU 内核库,覆盖 MoE 路由、FP8/FP4 量化、Engram 条件记忆门控、流形超连接(mHC)等核心操作。这不是一个普通的内核库,而是 DeepSeek V4 架构的基础设施层。本文综合 3 篇论文 + 4 个代码仓库,从编译器设计到模型架构,完整拆解这套系统。全景图:四个项目的关系┌─────────────────────────────────────────────────────────┐ │ DeepSeek V4 架构 │ │ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ mHC │ │ Engram │ │ MoE │ 模型架构层 │ │ │ 残差连接 │ │ 条件记忆 │ │ 专家路由 │ │ │ └────┬─────┘ └────┬─────┘ └────┬─────┘ │ │ │ │ │ │ │ ┌────┴──────────────┴───────