01导语各位同学大家好。现在做影像组学如果还只停留在“提取特征—建个模型—算个AUC”那就有点像算命算得挺准但为啥准自己也说不明白。别人一问你这特征到底代表啥背后有啥道理瞬间就成了黑箱本箱。而真正能打高分、站得住脚的研究都在干一件事——给影像组学找“生物学娘家”让宏观图像和微观病理、细胞、基因、通路对上话。今天咱们就通过这篇最新文献看看作者如何把CT影像的宏观异质性与HE病理的细胞核形态、肿瘤微环境淋巴细胞浸润巧妙串联不仅预测新辅助化疗免疫治疗的病理完全缓解还把每个特征、每条决策路径都解释得清清楚楚。咱们用轻松又实在的方式聊聊影像组学怎么优雅、合理、不硬凑地挂靠生物学机制从“只会算分的工具人”升级成“能讲清疾病故事的研究者”。★题目Interpretable multimodal radiopathomics model predicting pathological complete response to neoadjuvant chemoimmunotherapy in esophageal squamous cell carcinoma可解释的多模态放射病理组学模型预测食管鳞状细胞癌新辅助化疗免疫治疗后的病理完全缓解★期刊《Journal for ImmunoTherapy of Cancer》中科院1区IF10.6★研究疾病食管鳞状细胞癌ESCC★生物学机制肿瘤微环境TME免疫状态、肿瘤细胞核异型性与基因组不稳定性、肿瘤宏观异质性★发表时间2025年12月02研究背景-从 “临床问题” 落到 “生物学问题”食管鳞状细胞癌ESCC是全球高发的侵袭性恶性肿瘤对于局部晚期患者新辅助化疗联合免疫治疗nCIT后手术已成为极具前景的治疗策略病理完全缓解pCR率可达16.7%–50.0%且pCR与长期生存改善密切相关。若能术前准确预测pCR将有助于筛选适合“观察等待”策略的患者避免不必要的手术创伤实现器官功能保留和个体化治疗。然而目前临床依赖的传统生物标志物如微卫星不稳定性、PD-L1表达、肿瘤突变负荷等预测效能有限且检测成本高、操作复杂难以在临床常规推广。因此亟需开发无创、低成本、可解释的预测工具。影像组学可从常规增强CT中提取肿瘤宏观异质性特征如纹理、小波能量反映肿瘤血供、坏死、增殖活性等表型病理组学则从治疗前HE染色全切片图像中量化细胞核形态面积、偏心率、染色质均匀性及肿瘤微环境TME组成如淋巴细胞浸润、坏死比例等。这两类特征分别从宏观肿瘤整体行为和微观细胞与微环境状态两个层面共同映射了肿瘤对nCIT应答的生物学机制——例如高淋巴细胞浸润提示免疫“热”肿瘤核异型性反映基因组不稳定性影像高密度区域可能与活跃增殖区相关。因此整合影像组学与病理组学有望构建一个生物学可解释的多模态预测模型填补临床需求与机制理解之间的空白。03研究目的明确写出“三层目的”本研究设定明确的三层目的第一层临床目的开发和外部验证一个可术前预测ESCC患者接受nCIT后pCR的多模态机器学习模型为临床决策如主动监测 vs 及时手术提供个体化依据。第二层技术目的系统比较单模态模型仅影像组学或仅病理组学与多模态融合模型的性能差异并评估两种融合策略——中间融合特征级拼接与晚期融合概率级逻辑回归——对预测准确性的影响确定最优建模方案。第三层机制目的将可解释性作为设计约束在特征层面和模型层面实现透明化通过SHAP分析识别驱动预测的核心影像组学与病理组学特征明确其正向或负向贡献方向利用Hover-Net对病理图像进行细胞核分割与分类定量比较pCR与非pCR组间肿瘤细胞、淋巴细胞、坏死细胞的占比差异揭示模型所捕捉的肿瘤微环境生物学信号同时通过决策路径可视化展示个体患者的逐级推理过程使模型的黑箱决策转化为可追溯的临床认知链从而将“预测”与“机制理解”紧密耦合。04研究思路最核心怎么挂靠机制本研究的核心思路是以生物学机制为桥梁将宏观影像表型与微观病理特征统一于pCR预测任务中。首先从三个医疗中心入组335例ESCC患者获取治疗前增强CT和HE染色全切片图像。影像组学方面使用PyRadiomics提取1094个特征经LASSO和SVM-RFE筛选出14个关键特征如wavelet.LLH_firstorder_90Percentile该特征量化小波子带中高亮度体素分布可能反映肿瘤富血供、高增殖活性区域与化疗免疫药物递送效率相关。病理组学方面利用CellProfiler提取4892个特征最终保留11个如Texture_InverseDifferenceMoment_Hematoxylin核染色质均匀性和Mean_FilteredNuclei_AreaShape_HuMoment核不对称性这些特征直接量化核异型性、染色质纹理与肿瘤去分化程度和基因组不稳定性相关。为挂靠机制进一步使用Hover-Net对病理图像进行核分割与细胞类型分类比较pCR与非pCR组的淋巴细胞浸润比例、坏死细胞比例等TME指标验证模型是否真正学习到免疫响应的生物学特征。在建模上采用中间融合特征拼接XGBoost与晚期融合概率逻辑回归并以SHAP分析展示每个特征对个体和群体预测的贡献方向。最后通过决策路径可视化展示模型如何按阈值逐级整合影像与病理证据模拟临床医生整合多模态信息的推理过程。这一思路确保了模型不仅“预测准”而且“说得清”实现了从表型特征到生物学机制的闭环验证。05数据和方法机制部分怎么设计数据共纳入335例接受nCIT后手术的ESCC患者来自三个中心。其中浙江肿瘤医院296例按6:4随机分为训练集181例和内部测试集115例另外两个中心武汉大学人民医院22例、天津医科大学肿瘤医院17例共39例作为外部测试集。训练集用于特征筛选和模型训练内部及外部测试集用于独立验证。方法①增强CT勾画ROI→PyRadiomics提取1094个影像组学特征②HE‑WSI选取5个肿瘤丰富视野→CellProfiler提取4892个病理组学特征③训练集内SMOTE平衡→Z‑score标准化→单变量Logistic筛选→Spearman去冗余|ρ|0.85→LASSO与SVM‑RFE取交集分别选出14个影像组学与11个病理组学特征④分别用7种算法构建单模态模型最优为XGBoost→多模态中间融合特征拼接XGBoost和晚期融合单模态概率Logistic⑤SHAP分析特征贡献→Hover‑Net核分割与细胞分型→决策路径可视化。图 1研究整体工作流程图该图展示了从原始数据到模型解释的完整流程增强CT和HE‑WSI分别经手动勾画ROI与肿瘤视野选取后并行提取影像组学PyRadiomics与病理组学CellProfiler特征。经过SMOTE平衡、标准化、单变量筛选、Spearman去冗余及LASSOSVM‑RFE两级选择获得14个影像组学特征和11个病理组学特征。随后构建单模态、中间融合MIFM和晚期融合MLFM模型并通过SHAP分析、决策路径可视化和细胞类型定量进行可解释性评估。影像组学特征在此流程中作为宏观肿瘤异质性的量化桥梁其小波纹理、灰度共生矩阵等指标直接关联肿瘤血供、坏死和增殖活性等生物学表型。06研究结果”从表型到机制“①患者与模型总体表现335例中pCR率为22.99%。中间融合模型MIFM在训练、内部测试、外部测试集的AUC分别为0.97、0.78、0.76显著优于单模态模型影像组学最高AUC 0.90/0.74/0.68病理组学0.88/0.68/0.67且MIFM特异性高达0.93–0.96擅长排除非pCR患者。图 2模型性能与预测结果图2A–B雷达图比较7种算法在单模态模型中的AUCXGBoost在影像组学和病理组学中均表现最优为后续融合提供基础。图 2CSankey图显示MIFM能纠正单模态错误分类将更多病例推向正确标签。图 2D–I展示ROC与PR曲线MIFM在训练集AUC达0.97内外测试集分别为0.78和0.76影像组学单模态AUC高于病理组学提示宏观异质性对pCR预测贡献更大。图 2J–N混淆矩阵与流程图表明MIFM特异性极高0.88影像组学特征如高密度区域90百分位数可能识别出富血供的“热肿瘤”从而准确排除非pCR患者。图 3生存预后分层该图展示基于实际pCR状态与MIFM预测pCR状态的Kaplan‑Meier总生存曲线。在训练集中实际pCR和预测pCR均显示显著的生存分离p值分别为0.009和0.005在内部测试集中趋势相似但未达统计学显著性p0.069和0.059外部测试集因样本量小和死亡事件少分离不显著。预测pCR对生存的分层能力与实际pCR方向一致说明模型捕捉到的影像组学特征如小波低频子带纹理和病理组学特征如核不对称性不仅关联短期治疗响应还可能反映与长期生存相关的肿瘤侵袭性和免疫微环境状态。②关键影像组学与病理组学特征SHAP分析显示影像特征wavelet.LLH_firstorder_90Percentile反映高密度增殖区和病理特征Texture_InverseDifferenceMoment_Hematoxylin核染色质均匀性、Mean_FilteredNuclei_AreaShape_HuMoment核不对称性是主要驱动因子。跨模态相关性低-0.57~0.69提示两者提供互补生物学信息。③肿瘤微环境细胞组成基于Hover‑Net定量pCR组相比非pCR组肿瘤细胞和淋巴细胞比例更高坏死细胞比例更低。模型预测的pCR组呈现完全相同的趋势说明模型学习到了具有免疫生物学意义的TME模式。④决策路径可视化典型病例显示当单模态意见不一致时患者A影像支持pCR、病理反对MIFM能整合证据做出正确判断决策路径图逐级展示特征阈值与累积得分变化使模型推理过程对临床医生完全透明。图 4可解释性与机制挂靠图4ASHAP蜂群图显示影像特征wavelet.LLH_firstorder_90Percentile高密度区和病理特征Texture_InverseDifferenceMoment_Hematoxylin核染色质均匀性是主要驱动因子高值分别指向增殖活跃区和核异型性。图 4B跨模态相关性网络显示影像与病理特征间相关性低-0.57~0.69证实两者提供互补的生物学信息宏观异质性vs微观核形态。图 4C箱线图比较细胞类型比例pCR组肿瘤细胞和淋巴细胞比例更高、坏死细胞更低模型预测组重现相同趋势说明模型学习到了免疫“热”微环境的生物学信号。图 4D病例小插图展示了决策路径患者A影像支持pCR、病理反对MIFM仍正确判断路径图逐级展示阈值和累积得分将影像组学特征如何一步步推动预测变得完全透明。07讨论把机制故事讲圆本研究构建并外部验证了一个可解释的多模态影像‑病理组学融合模型用于术前预测ESCC患者nCIT后的pCR。讨论部分的核心在于将模型预测与生物学机制串联成一个完整的故事。首先影像组学特征中表现最突出的是小波子带的高百分位数特征如wavelet.LLH_firstorder_90Percentile该特征量化了肿瘤内最亮体素的分布可解释为富血供、高增殖活性的“热区”这类区域往往具有更好的药物递送和免疫细胞浸润条件从而对nCIT更敏感。其次病理组学特征中核染色质均匀性逆差矩和核不对称性Hu矩直接反映了细胞核的异型性与去分化程度高核异型性常伴随基因组不稳定性可能产生更多新抗原增强免疫识别。这些宏观与微观特征的低相关性-0.57~0.69恰好说明两者从不同维度捕捉肿瘤生物学影像组学反映整体肿瘤异质性与血管状态病理组学聚焦单个细胞核形态与微环境构成。进一步通过Hover‑Net对HE图像的核分割与细胞分类我们直接观察到pCR组具有更高的淋巴细胞浸润比例提示免疫“热”肿瘤和更低的坏死比例提示微环境完整性这一趋势在模型预测的pCR组中完全复现证实模型确实学习到了与免疫应答直接相关的TME生物学信号。在可解释性设计上我们不仅提供SHAP全局特征重要性还通过决策路径可视化展示了模型如何在个体患者中逐级整合影像与病理证据模拟了临床多学科讨论的认知过程。这种将透明性作为设计约束的做法有效缓解了临床对“黑箱”AI的信任障碍。当然本研究存在局限性回顾性设计、外部队列较小、未纳入PD‑L1/TMB等分子标志物、细胞分类存在算法误差。未来需前瞻性大样本验证并整合基因组学证据以进一步夯实机制假设。08这篇文献的可借鉴思路这篇论文为影像组学与病理组学融合预测治疗响应提供了多个可直接迁移的设计思路。第一多模态融合的策略选择。作者系统比较了中间融合特征级拼接XGBoost与晚期融合概率级逻辑回归发现中间融合更优。启示当两种模态特征数量适中且互补性强时特征级拼接能更充分地保留跨模态交互信息优于概率后融合。第二可解释性作为设计约束而非事后补丁。论文从特征筛选阶段就保留了数学/形态学定义明确的特征如核面积、灰度共生矩阵使后续SHAP分析和决策路径图具有天然的可沟通性。研究者应优先选择“看得懂”的特征而非一味追求复杂深度学习特征。第三利用常规HE图像提取肿瘤微环境细胞组成。作者采用开源的Hover‑Net对病理图像进行核分割与粗细胞分类肿瘤细胞、淋巴细胞、坏死细胞等无需额外染色或测序即可将TME的免疫状态纳入分析框架这对于缺乏多组学数据的回顾性研究尤其实用。第四决策路径可视化的设计。作者将树模型XGBoost的每步分裂阈值与特征增量以流程图形式展示使个体预测结果可追溯、可复核。这一方法不限于XGBoost也可推广到随机森林、LightGBM等树模型极大增强了临床落地时的信任度。第五从“预测”延伸到“机制假设”的论证逻辑。论文没有停留在AUC高低而是通过细胞类型定量比较、特征生物学释义、跨模态相关性分析构建了一个从影像表型→微观核形态→TME免疫状态→pCR的因果链条即使缺乏基因表达数据也能提出合理、可验证的生物学假说。第六用户友好的GUI工具。作者提供了一个浏览器基的图形界面临床医生只需上传CT、ROI掩膜和CellProfiler生成的CSV文件即可获得pCR概率。这种“研究转化”一体化的思维极大提升了论文的临床影响力。总之该研究为如何将多模态影像病理组学、可解释AI、肿瘤生物学机制三者有机结合提供了一个高完整度的范例。09结语总而言之做影像组学不只是拼AUC、堆模型更要学会给特征找意义、给模型讲道理。这篇论文给我们展示了极佳的范本小波高密度区对应肿瘤富血供增殖区核不对称性反映去分化与基因组不稳定淋巴细胞比例直接指向免疫“热”微环境——每一步都有生物学落脚点。只有把宏观影像和微观机制真正打通我们的研究才不是“玄学算命”而是有根有据、有血有肉、能讲好疾病故事的真科研。希望大家以后都能少走弯路轻松写出有机制、有深度、能发高分的好文章参考文献Qi B, Jiang Z, Shen H, Li J, Wang Z, Fang M, Wang C, Jiang Y, Yuan J, Bermejo I, Dekker A, Ruysscher D, Wee L, Zhang W, Ji Y, Zhang Z. Interpretable multimodal radiopathomics model predicting pathological complete response to neoadjuvant chemoimmunotherapy in esophageal squamous cell carcinoma. J Immunother Cancer. 2025 Dec 21;13(12):e013840. doi: 10.1136/jitc-2025-013840.