011、MLIR的Pattern Rewrite框架：DRR与C++ Rewrite

张

张建站

2026/6/9 6:07:35

10分钟阅读

011、MLIR的Pattern Rewrite框架：DRR与C++ Rewrite

MLIR的Pattern Rewrite框架：DRR与C++ Rewrite上周帮团队排查一个MLIR自定义Pass的bug，现象很诡异：同一个IR经过两次Pass后，某些op的operand顺序莫名其妙变了，导致下游的bufferization直接崩掉。我盯着dump出来的IR看了半小时，最后发现是Pattern Rewrite的匹配优先级在作祟——一个DRR生成的pattern和一个手写的C++ Rewrite pattern互相覆盖了。这种问题在MLIR的pattern rewrite框架里太容易踩坑了，今天就把这块掰开揉碎讲清楚。为什么需要两套Rewrite机制MLIR的pattern rewrite框架本质上解决的是“如何在IR上做局部变换”的问题。你写一个Pass，无非就是遍历op，匹配某种结构，然后替换成另一种结构。但MLIR的IR是SSA形式的DAG，不是简单的树，所以匹配和替换的复杂度比AST rewrite高一个量级。MLIR给了两条路：DRR（Declarative Rewrite Rules）和C++ Rewrite。DRR用TableGen写声明式规则，自动生成C++代码；C++ Rewrite则是手写继承OpRewritePattern的类。两条路各有适用场景，但混用的时候坑特别多。DRR：看起来很美，但别被它骗了DRR的语法确实简洁，比如你想把addi和muli合并成一个fused_mul_add：def FuseMulAdd : Pat (addi (muli $x, $y), $z), (fused_mul_add $x, $y, $z) ;三行搞定。但实际项目里DRR有几个隐藏的坑。第一个坑：DRR生成的pattern是“贪婪”的。它默认会匹配所有可能的子图，而且匹配顺序由TableGen生成的代码决定，不是你写的顺序。我遇到过DRR把一个muli同时匹配到两个不同的pattern里，导致IR被重复改写。解决办法是在DRR里显式指定PatternBenefit，但很多人不知道DRR也支持这个：def FuseMulAdd : Pat (addi (muli $x, $y), $z), (fused_mul_add $x, $y, $z) ; // 这里踩过坑：不加benefit的话，默认benefit是1，容易被其他pattern覆盖 let benefit = 10;第二个坑：DRR对op的约束检查是“静态”的。它只能检查op的类型和operand数量，没法做动态的运行时检查。比如你想只在x和y都是float类型时才做融合，DRR里写不了这种条件。你必须在生成的C++代码里手动加NativeCodeCall，但那样又失去了DRR的简洁性。第三个坑：DRR生成的pattern无法处理“副作用”。如果你的rewrite需要修改op的属性、插入新的op、或者做复杂的类型推导，DRR基本无能为力。这时候就得老老实实写C++ Rewrite。C++ Rewrite：手写才是硬道理C++ Rewrite的核心是继承OpRewritePattern，重写matchAndRewrite方法。这里有个关键点：matchAndRewrite返回LogicalResult，成功返回success()，失败返回failure()。别写成return true或return false，MLIR的框架会检查返回值类型，写错了编译不过，但运行时行为可能诡异。一个典型的C++ Rewrite长这样：structFuseMulAddPattern

别再只用欧氏距离了！深入浅出聊聊A*寻路中那个高效的‘平替’：Octile距离

突破性能瓶颈：A*寻路中Octile距离的实战价值在机器人路径规划和游戏AI开发中，A*算法因其平衡效率与准确性的特点成为首选方案。但许多开发者可能没有意识到，算法中一个看似简单的选择——启发函数的设计，往往成为制约性能的关键因…...

2026/6/9 6:01:54 阅读更多 →

vRealize Operations Manager报告配置避坑指南：从导入失败到调度不执行的常见问题排查

vRealize Operations Manager报告配置深度排错手册：从导入到调度的全链路解决方案虚拟化环境的管理离不开高效的工具支持，而vRealize Operations Manager（vROps）作为业界领先的运维管理平台，其报告功能能够帮助管理员全…...

2026/6/9 5:50:29 阅读更多 →

别再只盯着Qi协议了！聊聊无线充电里那些‘土法炼钢’的载波通信方案

无线充电的隐秘角落：载波通信技术在小众场景中的突围战当大多数人谈论无线充电时，脑海中浮现的往往是Qi协议或AirFuel标准——这些成熟方案确实主导了消费电子市场。但在工业控制、教学实验和创意原型开发领域，一套截然不同的技术体系正悄然运…...

2026/6/9 5:48:34 阅读更多 →

CSDN AI分发撤回黄金15分钟法则：超时即不可逆！3类高危场景+2套应急回滚SOP（含工单提报话术模板）

更多请点击： https://kaifayun.com 第一章：CSDN AI 数字营销分发后的文章可以单独撤回某一个平台吗？ CSDN AI 数字营销平台在执行“一键多平台分发”时，会将同一份内容同步发布至 CSDN 博客、知乎、微信公众号（需授权…...

2026/6/9 6:08:31 阅读更多 →

OpenRocket：零基础掌握专业火箭设计与飞行仿真

OpenRocket：零基础掌握专业火箭设计与飞行仿真【免费下载链接】openrocket Model-rocketry aerodynamics and trajectory simulation software 项目地址: https://gitcode.com/GitHub_Trending/op/openrocket OpenRocket是一款功能强大的开源火箭设计与仿真…...

2026/6/9 6:08:29 阅读更多 →

请做coser的主人9下载2026官方正版

下载链接浅析全动态真人互动影像作品的工业化管线与设计逻辑：以《请做coser的主人9》为例近年来，随着硬件渲染能力的提升和流媒体解码技术的普及，全动态真人互动影像（Full Motion Video, 简称FMV）迎来了一波高频更…...

2026/6/9 6:08:30 阅读更多 →

深度解析移动端免Root系统提取工具：Payload-Dumper-Android技术架构与实现原理

深度解析移动端免Root系统提取工具：Payload-Dumper-Android技术架构与实现原理【免费下载链接】Payload-Dumper-Android Payload Dumper App for Android. Extract boot.img or any other partitions (images) from OTA.zip or payload.bin without PC 项目地址:…...

2026/6/9 6:08:30 阅读更多 →