MinerU 系列教程第十二课：公式识别 - LaTeX 的自动生成

张

张建站

2026/7/27 7:07:37

10分钟阅读

$MinerU 系列教程第十二课：公式识别 - LaTeX 的自动生成$

MinerU 系列教程第十二篇本篇教程作为模块三：核心模型深度解析的第四课，将深入剖析 MinerU 的公式识别（MFR，Mathematical Formula Recognition）子系统。我们将了解 UniMERNet 与 PP-FormulaNet Plus M 两种后端如何将文档中的数学公式图像转换为 LaTeX 字符串，探究动态批处理的面积分组策略，以及一套精密的 LaTeX 后处理管线如何修复模型输出中的各种语法缺陷。学习目标完成本课学习后，你将能够：理解 MinerU 公式识别的两种后端架构及其适用场景掌握行间公式与行内公式在 Pipeline 中的不同处理路径理解基于面积的动态批处理分组策略（2 的幂次）深入了解 LaTeX 后处理管线的五大修复函数追踪公式识别在batch_analyze.py中的完整编排流程通过环境变量MINERU_FORMULA_CH_SUPPORT在两种后端之间切换一、公式识别在 Pipeline 中的位置在 MinerU 的文档解析流程中，公式识别处于版面分析之后、OCR 文字识别之前的关键位置。让我们先从全局视角理解它在 Pipeline 中的角色：

热轧钢带缺陷数据集，称为Xsteel表面缺陷数据集（X-SDD），其中包含七种典型的热轧带钢缺陷类型，共有1360个缺陷图像。与常用的NEU表面缺陷数据库（NEU-CLS）的六种缺陷类型相比，X-SD

热轧钢带缺陷数据集，称为Xsteel表面缺陷数据集（X-SDD），其中包含七种典型的热轧带钢缺陷类型，共有1360个缺陷图像。与常用的NEU表面缺陷数据库（NEU-CLS）的六种缺陷类型相比，X-SDD包含…...

2026/7/26 23:19:02 阅读更多 →

【GitHub项目推荐--LingBot-Map：流式 3D 重建的几何上下文 Transformer】⭐⭐⭐⭐⭐

LingBot-MapGitHub 地址：https://github.com/Robbyant/lingbot-map 简介 LingBot-Map 是由 Robbyant 团队开源的一个前馈式 3D 基础模型，专为流式（Streaming）3D 场景重建而设计。它摒弃了传统 SLAM 或 NeRF 需要复杂迭代优化的…...

2026/7/26 23:25:48 阅读更多 →

STM32智能小车循迹：从if-else到PID，我的代码优化与性能提升实战

STM32智能小车循迹：从if-else到PID的代码演进与性能优化实战去年夏天调试实验室的第四代智能小车时，发现初版循迹代码在复杂赛道上会出现明显的"蛇形走位"。这个现象促使我重新思考嵌入式系统中控制算法的实现方式——如何用更优雅的代码结构…...

2026/7/26 14:34:28 阅读更多 →

大模型 Agent 三面被问：怎么解决 Skill 的依赖关系？我是这么答的

前段时间有个读者去面某大厂的 Agent 岗位，三面被甩出来一道题当场卡壳。题目听着挺朴素：“如果你的 Agent 里面有很多 Skill，Skill 之间还存在依赖关系的话，你打算怎么去设计来解决这个问题？” 他跟我复盘的时候说&a…...

2026/7/26 0:13:33 阅读更多 →

抱怨应试教育的苦，却不知道：那已经是人生里最轻松、最公平的一段路了

能靠考试得到的东西，都是天上掉馅饼上学的时候，总觉得考试是天底下最熬人的苦。背不完的知识点，刷不完的题，熬不完的夜，一张卷子定输赢的应试制度，曾被无数人吐槽是束缚、是枷锁。那时候总天真地以为，等走出校园、踏入社会，就能摆脱考试的桎梏，凭真本事自由闯荡。 …...

2026/7/26 0:20:22 阅读更多 →

华硕笔记本终极控制工具：如何用G-Helper取代臃肿的Armoury Crate

华硕笔记本终极控制工具：如何用G-Helper取代臃肿的Armoury Crate 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Z…...

2026/7/26 0:31:13 阅读更多 →