顶刊TPAMI！打破“深度学习=黑盒“的范式！国防科大揭示红外弱小目标检测一关键归因

张

张建站

2026/5/5 23:12:08

10分钟阅读

顶刊TPAMI！打破“深度学习=黑盒“的范式！国防科大揭示红外弱小目标检测一关键归因

点击下方卡片关注“CVer”公众号AI/CV重磅干货第一时间送达点击进入—【顶会/顶刊】投稿交流群添加微信号CVer2233小助手拉你进群扫描下方二维码加入CVer学术星球可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用发论文/搞科研/涨薪强烈推荐转载自遥感与深度学习在军事侦察、海上搜救、无人机监控等关键场景中红外小目标检测技术是实现千里眼的核心能力。然而现实情况令人沮丧当目标信噪比极低时现有算法常常失效——要么误将动态杂波或噪声当作目标要么彻底漏检真正的威胁。更令人困惑的是这些深度学习模型究竟是看到了什么才做出判断的没人说得清楚。国防科技大学最新研究成果《Probing Deep into Temporal Profile Makes the Infrared Small Target Detector Much Better》DeepPro为这一系列难题提供了系统性的新答案。题目Probing Deep into Temporal Profile Makes the Infrared Small Target Detector Much Better期刊IEEE Transactions on Pattern Analysis and Machine Intelligence论文https://arxiv.org/abs/2506.12766项目https://tinalrj.github.io/DeepPro/代码https://github.com/TinaLRJ/DeepPro年份2026作者李若敬安玮王应谦应昕怡戴一冕王龙光李淼郭裕兰刘丽痛点红外小目标检测的“三重挑战”红外弱小目标检测IRST长期面临一个核心困境——精度、鲁棒性、效率三者难以兼得。论文指出这一困境的根本原因在于目标与场景自身特性所带来的三大固有挑战高精度挑战目标本身极小通常仅占 ≤ 9×9 像素、极暗SNR ≤ 3缺乏形状、纹理等充分的外观特征难以构建有效的特征表征同时背景往往不平滑、不均匀充斥着杂波和噪声它们几乎占据整幅图像且部分与目标高度相似导致虚警难以抑制。高鲁棒性挑战在运动条件下目标特性随时域演化——目标强度不断变化其局部背景也在动态改变此外实际场景中包含多样的复杂背景各具不同的杂波特性和多种灰度分布截然不同的目标这些复杂因素使得在多样化场景中持续、稳定地检测目标极为困难。高效率挑战红外弱小目标检测的应用需要实时处理海量数据流而目标在空间域上又极其稀疏因此很难平衡充分的特征提取与高效的计算。现有深度学习方法追求从空域和短时时空域中提取更多信息不可避免地扩大感受野造成严重计算冗余更加损害了实时处理能力。一个根本性问题浮现在极端复杂场景下到底哪个建模域能更好地呈现目标哪种先验信息能更有效地捕获目标与背景之间的本质差异图1: 不同域中小目标可视化对比。在空域(c2)和短时时空域(c3)弱小目标几乎不可见或与干扰无法区分而在时域剖面(c4)中目标信号清晰、完整且突出。突破从“黑盒炼丹”到“可解释探针”研究者们往往依靠来自传统领域以及深度学习领域的知识通过搭建复杂的网络结构期望提取“more”特征。然而这一路线是否足够明智和高性价比网络在拟合了大量数据后到底依赖什么“more essential”信息进行决策深入探究这些问题对我们理解网络、发现关键决策依据和解决“三重挑战”问题很重要。DeepPro 团队没有走“堆叠模块、增大模型”的老路而是从归因与理论分析出发首次在红外弱小目标检测领域构建了可解释性分析工具系统性地回答了两个关键问题1. 训练好的网络究竟在“看”什么为探究拟合了大量数据的网络以什么信息为关键特征实现检测团队构建了该领域首个预测归因Attribution工具通过梯度归因揭示网络决策机制。归因分析给出了两点关键发现发现一对网络预测影响最大的像素集中在目标的时域剖面附近并沿时间轴成呈圆柱状分布。这意味着网络在做出正确判断时核心依赖的是目标的时域剖面信息。图6: 现有网络对目标区域预测的归因可视化。归因结果直观揭示网络最关注的是目标区域沿时间轴连续分布的像素这正是时域剖面信息的核心体现。发现二时域剖面上参考帧的重要性随时间呈U型曲线变化。在一段时间内远时刻信息也像近时刻信息一样重要。这说明时域剖面上信号的长期变化对红外小目标检测十分重要。图7: 平均影响力随参考帧时间的变化。核心洞察两点发现共同指向一个结论——时域剖面信息是网络做出正确判断的关键依据。2. 时域剖面上的“关键信息”是什么研究团队从信号处理角度深入分析了红外弱小目标在时域剖面Temporal Profile中的特性。时域剖面记录了固定空间位置上所有信号随时间的统计变化。关键发现如下全局时域显著性当弱小目标穿越探测单元时其强度随时间呈现先增后减的规律性波动——这是目标区别于随机噪声的本质特征。在 SNR ≤ 3 的极端条件下目标在空域几乎不可见但在时域剖面中依然清晰突出。图4: 真实复杂场景下不同 SNR 目标的空域与时域剖面对比。当 SNR 3 时空域目标几乎不可见但时域剖面中目标信号依然显著。相关性信息时域剖面中包含目标信号和其他信号之间的相关性信息。即使在强干扰环境下目标信号仍保持自相关性并与杂波和噪声信号无关。图5: 干扰下目标信号的时域剖面可视化图和目标、噪声、动态杂波之间的相关性分析结果。不同程度干扰下目标信号始终保持显著自相关性并与其他信号无关。因此充分利用时域剖面上的这些特性能够支撑实现极弱小目标的高精度和高鲁棒检测。方法DeepPro——领域首个一维时域探针网络基于上述归因发现和理论分析DeepPro 团队将红外弱小目标检测任务重新建模为一维时序信号异常检测问题并提出了领域内首个仅在时域进行计算的深度时域探针网络Deep Temporal Probe Network,DeepPro。图9: DeepPro 整体框架。TPro像素级时域探针机制从时域剖面中提取关键特征仅通过一维时域乘加运算完成目标检测。核心创新像素级时域探针机制TPro图8: TPro 结构图。TPro 的设计基于信号在时域剖面上的可区分性特性时域探针抽取完整时域特征为输入特征图的每个空间位置抽取其时域特征固定空间位置 × 时间维通过时域探针从输入特征中拉取单个像素的完整时域特征将高维时空内的检测问题转化为一维时序异常检测。SCorM 提取时域相关性特征在获得逐像素时域特征后TPro 应用多个可学习的信号相关性矩阵Signal Correlation Matrix, SCorM从时域特征中提取信号间的相关性特征。SCorM 的作用在于利用前述理论分析揭示的目标信号与噪声/杂波在时域剖面上的相关性差异目标信号保持自相关性且与噪声和杂波信号无关通过学习到的相关性使目标特征被增强、背景特征被抑制从而在极低 SNR 和强干扰条件下实现可靠的目标-背景分离。整个 TPro 流程排除任何空间维度计算所有乘加运算仅在一维时域完成无需复杂的空间卷积或时空注意力同时实现了极致的轻量化设计。结果精度、鲁棒性、效率全面超越DeepPro 在多个红外数据集上进行了全面验证包括 NUDT-MIRSDT、NUDT-MIRSDT-HiNo、IRSDT-simulation、IRSatVideo-LEO、RGBT-Tiny 五大数据集涵盖仿真数据集和实测数据集天基视角数据集和陆基、空基视角数据集显著目标数据集和极低信噪比/高噪数据集。以下是与现有最优方法的对比结果表2: 对比实验结果。1. 低 SNR 场景下的检测性能在NUDT-MIRSDT数据集SNR ≤ 3 的弱小目标上DeepPro 的性能对比如表2第一个子数据集。✨关键数据DeepPro 在 SNR ≤ 3 的条件下实现了95.84% 的检测率和的虚警率相比现有最优方法以更低虚警提升检测率超3 个百分点检测性能远超对比方法。2. 计算效率对比模型参数量和推理速度在大小图像上对比结果如表2最后两列以及不同模型的浮点计算量在大小图像上对比结果如下表所示。表3: 更多对比结果以及计算量对比。✨极致轻量化DeepPro 参数量相比对比算法中最轻量的单帧方法ACM减少了87.6%同时推理速度FPS达到184 帧每秒提升13 帧每秒仅次于单帧检测模型Res-UNet。DeepPro 在大小图像上的计算量仅为1.01GFLOPs仅高于单帧算法ALCNet的计算量。3. 鲁棒性验证强噪声场景在高噪数据集NUDT-MIRSDT-HiNo上DeepPro 的性能对比如表2最后一个数据集。同时在各种不同噪声强度条件下DeepPro 的性能对比如下图。图15: 不同噪声条件下不同网络性能对比。✨复杂场景稳健DeepPro 在强噪声干扰和复杂背景下依然保持最优检测性能。因此我们的 DeepPro 对于不同的噪声强度具有更优的鲁棒性。更多图表分析和消融实验可见原文意义打破范式开辟新思路DeepPro 的贡献远超一项“更好的检测算法”它推动了该领域的范式转变新建模域将红外弱小目标检测建模为一维时序信号异常检测问题突破了现有深度模型在二维空间/时空联合建模的局限。新洞察通过领域首个可解释性分析工具揭示了时域剖面信息是红外弱小目标检测的“更关键信息”并不意味着否定空域信息或短时时空信息DeepPro-Plus的更优表现充分证明了这一点为后续算法设计提供了理论指导。⚡ 新方法提出了首个完全基于时域计算的目标检测网络证明了更本质的特征比“更多次重要”的特征更有效。新性能在精度、鲁棒性和效率三个维度上同时实现突破突破了该领域长期存在的“三重挑战”问题。更多图表分析可见原文本文系学术转载如有侵权请联系CVer小助手删文何恺明在MIT授课的课件PPT下载在CVer公众号后台回复何恺明即可下载566页课件PPT大家赶紧学起来CVPR 2026 所有论文和代码下载在CVer公众号后台回复CVPR2026即可下载CVPR 2026 所有论文和代码CV垂直方向和论文投稿交流群成立扫描下方二维码或者添加微信号CVer2233即可添加CVer小助手微信便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖目标检测、图像分割、目标跟踪、人脸检测识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。一定要备注研究方向地点学校/公司昵称如Mamba、多模态学习或者论文投稿上海上交卡卡根据格式备注可更快被通过且邀请进群▲扫码或加微信号: CVer2233进交流群 CVer计算机视觉知识星球人数破万如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料一定要扫描下方二维码加入CVer知识星球最强助力你的科研和工作 ▲扫码加入星球学习▲点击上方卡片关注CVer公众号整理不易请点赞和在看

我做副业的10款AI工具

我的数字产品业务每个月稳定带来3000美元的被动收入。我用一套精简的AI工具栈搭建了整个业务，涵盖内容创作、设计、销售自动化和流量驱动的落地页。在这篇文章中，我将分享我用来运营业务的AI工具，以及其他创作者在2026年正在使用的工具。…...

2026/5/5 23:10:31 阅读更多 →

别再只盯着Zipkin了！Spring Cloud微服务用SkyWalking 8.6.0做链路追踪，从安装到日志集成保姆级教程

微服务链路追踪新选择：SkyWalking 8.6.0深度实践指南在微服务架构日益普及的今天，系统复杂度呈指数级增长。一个简单的用户请求可能涉及数十个服务的协同工作，传统的日志排查方式已无法满足需求。这正是分布式链路追踪技术大显身手的时刻——…...

2026/5/5 23:00:42 阅读更多 →

B站字幕下载终极指南：轻松获取CC字幕的完整教程

B站字幕下载终极指南：轻松获取CC字幕的完整教程【免费下载链接】BiliBiliCCSubtitle 一个用于下载B站(哔哩哔哩)CC字幕及转换的工具; 项目地址: https://gitcode.com/gh_mirrors/bi/BiliBiliCCSubtitle 还在为无法保存B站视频的字幕而烦恼吗？想要…...

2026/5/5 22:56:05 阅读更多 →

如何用Python脚本绕过百度网盘限速？5个实用技巧大揭秘

如何用Python脚本绕过百度网盘限速？5个实用技巧大揭秘【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 上周，当我需要从百度网盘下载一个3GB的设计素材时…...

2026/5/5 6:11:25 阅读更多 →

构建Web3多智能体世界：从账户抽象到AI驱动的链上经济

1. 项目概述：一个由AI驱动的Web3多智能体世界EmpowerTours 是一个我深度参与构建的、运行在 Monad 区块链上的综合性 Web3 平台。它不仅仅是一个应用，更是一个持续运行的多智能体世界，并深度集成在 Farcaster 社交协议中，作为一个…...

2026/5/5 6:16:07 阅读更多 →

2026届最火的降AI率网站推荐榜单

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 需要从源头优化以及后期校正两方同时着手，来降低文本里AIGC也就是人工智能生成内…...

2026/5/5 4:22:03 阅读更多 →