深度学习篇---积分图加速

张

张建站

2026/6/22 19:23:32

10分钟阅读

一、为什么会有积分图——一个真实困境想象你在做一个人脸检测程序照片是 1000×1000 像素你需要在这个大图上滑动一个窗口检查每个位置是不是人脸每个窗口里要计算几十种特征比如左眼区域和右眼区域的亮度差每个特征都要累加窗口内某个小矩形里的所有像素值如果用暴力方法每看到一个矩形就把里面所有像素加起来。一个 20×20 的矩形就是 400 次加法一张图要检查几万个窗口每个窗口几十个特征……结果一张照片要算几亿次加法一秒处理不了一两张图。这个速度别说实时视频了连看照片都卡。核心痛点大量重复的、不同大小和位置的矩形求和操作每次都要重新累加太慢了。二、积分图的核心思想——聪明地提前算好积分图的想法极其简单把每个位置左上角所有像素的总和提前算出来存成一张新图。这张新图就是积分图。打个比方假设你是一个仓库管理员经常要统计某个货架区域里货物的总重量。笨办法每次有人问你就跑到那个区域把每个货架上的货物挨个称一遍。区域越大越慢。聪明办法提前把所有位置从门口到当前位置的累计重量算好列成一张表。以后任何人问任何矩形区域的重量你只需要查表的四个数字做三次加减法瞬间出结果不管区域多大。积分图就是这张累计重量表。三、怎么用完全不看公式假设你已经有了积分图。现在想算图中任意一个矩形区域的像素总和找到矩形右下角那个点的积分图数值 → 代表从左上角到右下角的总和减去矩形左边那一大块不要的部分减去矩形上边那一大块不要的部分加回左上角那块被减了两次的部分就这样四个点的数值三次减法一次加法完事。不管你问的矩形是 5×5 还是 500×500都是这几下操作速度完全一样。四、优点为什么要用它优点说明极快矩形求和从依赖面积变成常数时间不管矩形多大都是几步运算一次构建无数次使用只要提前花一次时间算好积分图后续几万次查询都快如闪电实现简单核心代码不超过20行无额外依赖纯数学运算不需要特殊硬件或库可组合可以同时算普通积分图、平方积分图用于方差、旋转积分图等实际加速效果一个 1000×1000 的图像做 10 万次矩形查询暴力法几十亿次加法积分图一次预处理 30 万次加减法加速几百到上千倍这就是为什么 2001 年的普通电脑就能实时检测人脸。五、缺点局限性缺点说明只认矩形只能算轴对齐的矩形区域圆形、三角形、任意多边形都不行除非用变体一次预处理成本不管后面查多少次都得先完整遍历一遍整张图。如果只查一两个矩形反而更慢内存翻倍要额外存一张和原图一样大的积分图。如果原图很大比如卫星图内存压力不小数字会爆大图大区域累加和可能非常大。需要用更大范围的整数类型比如 int64不适合极度稀疏查询如果整张图只问两三次矩形暴力反而更简单六、经典应用场景1. 人脸检测最著名的应用Viola-Jones 人脸检测算法要在每张图上计算十几万个矩形特征。用了积分图之后从不可能实时变成第一代实时人脸检测是计算机视觉的里程碑。2. 图像快速模糊Box Filter想做均值模糊就是每个像素取周围矩形的平均值。用积分图每个像素的模糊计算瞬间完成不依赖模糊半径。半径越大优势越明显。3. 自适应阈值处理扫描文档时光照不均匀。需要根据每个像素周围区域的亮度来决定黑白分界。积分图可以快速计算任意局部区域的均值和方差。4. 滑动窗口统计遥感图像分析、卫星图目标检测需要在图上滑动各种尺寸的窗口计算窗口内的统计量。积分图让这类任务从慢得没法用变成实时。5. 实时视频处理每一帧都要做几十次矩形统计积分图可以逐帧快速构建甚至用前一帧的结果增量更新。七、什么时候该用什么时候不该用该用的场景✅ 需要大量矩形区域求和成千上万次✅ 矩形大小变化很大大的矩形暴力计算特别慢✅ 可以接受一次性预处理比如静态图像✅ 实时性要求高视频、交互应用不该用的场景❌ 只问一两个矩形暴力反而简单❌ 需要任意形状区域除非用变体但变体也有局限❌ 内存极度紧张比如单片机、嵌入式极简环境❌ 图像超大且只查极少次八、一个生活化类比快递站取件暴力法每次有人来取件你都要走进仓库把那个区域的快递一个个找出来数一遍。区域越大越慢。积分图法你提前在每个货架上贴一个标签从这个货架到门口所有快递的总重量。以后任何人问A区到B区有多少重量你只需要看四个货架的标签心算一下秒答。九、一句话总结积分图二维前缀和用一次 O(N) 的预处理换来任意矩形求和的 O(1) 查询是空间换时间思想最漂亮的体现之一。它不是为了炫技而是为了解决一个非常实际的工程问题大量重复的矩形求和太慢了。在 Viola-Jones 人脸检测之后它成了计算机视觉工具箱里的标配。

058.日志系统搭建：用Python logging模块记录训练全过程

从一次深夜调试说起上周团队实习生跑了一夜YOLO训练，早上兴奋地跑来说mAP涨了5个点。我让他把训练曲线和关键日志给我看看，他愣了半天，最后掏出一堆print输出的txt文件，关键信息全混在终端输出里早被冲掉了。更头疼的是，当我想复现某个中间状态时，连当时的学习率、数据…...

2026/6/11 10:12:23 阅读更多 →

从HTML到PDF报表：手把手教你用Aspose.PDF for .NET 23.1.0搞定动态文档生成

动态PDF报表生成实战：Aspose.PDF for .NET高效开发指南在当今数据驱动的业务环境中，动态生成专业PDF报表已成为企业级应用的标配需求。无论是电商平台的订单明细、金融系统的对账单，还是医疗机构的检验报告，都需要将实时数据转化…...

2026/4/27 3:35:46 阅读更多 →

告别虚拟机！用Docker Desktop在Windows 10上5分钟快速搭建一个CentOS开发环境

5分钟在Windows 10上打造轻量级CentOS开发环境：Docker Desktop实战指南每次启动虚拟机都要等待漫长的系统加载？开发环境占用太多内存导致电脑卡顿？如果你正在寻找一种更高效的解决方案，那么Docker容器技术将彻底改变你的开发体验…...

2026/5/30 3:06:03 阅读更多 →

终极网盘直链下载指南：八大平台高速下载完全解决方案

终极网盘直链下载指南：八大平台高速下载完全解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

2026/6/22 11:26:33 阅读更多 →

抖音无水印下载终极指南：专业级开源工具完全解析

抖音无水印下载终极指南：专业级开源工具完全解析【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖…...

2026/6/21 0:08:48 阅读更多 →

考研英语黄皮书pdf|考研英语黄皮书原文外教朗读|考研英语真题手译本电子版

考研英语黄皮书pdf|考研英语黄皮书原文外教朗读|考研英语真题手译本电子版资料全科都有考研英语黄皮书 PDFhttps://tool.nineya.com/s/1jpq3effr 【英语真题】1. The word "resilient" means（ ） A. able to recover quickly B. very fragile C…...

2026/6/22 16:15:36 阅读更多 →

中兴光猫权限解锁工具：zteOnu完整使用指南与教程

中兴光猫权限解锁工具：zteOnu完整使用指南与教程【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 中兴光猫权限解锁工具zteOnu是一款专门用于开启中兴光猫设备工厂模式的强大…...

2026/6/22 2:39:53 阅读更多 →