近日,莫大-北理工-深北莫应用数学联合研究中心李春团队研究生薛志鹏以第一作者身份,李春为通讯作者,在国际计算机图形学领域权威期刊《IEEE Transactions on Image Processing》(TIP)发表题为《Uncertainty Quantification for Incomplete Multi-View Data Using Divergence Measures》的研究成果。该期刊影响因子高达 13.7,为中科院1区、CCF A类顶级学术期刊,论文录用需在理论与工程实践上对相关领域有重要推动作用,此次成果彰显了深北莫团队强劲的科研实力。


图一:论文期刊及索引
本研究针对现有多视图分类与聚类方法在面对噪声或缺失视图时,常依赖 Kullback–Leibler 散度而忽视跨模态差异的问题,提出了基于 Proper Hölder 散度(PHD)的 KPHD-Net 模型。KPHD-Net 首次将变分狄利克雷分布用于表征类别概率分布,结合 Dempster–Shafer 证据理论与卡尔曼滤波,实现了多视图证据的动态融合与不确定性量化。理论分析与大量实验证明,PHD 相较于传统 KLD 能更有效地度量分布差异,从而显著提升分类与聚类的准确性、鲁棒性和可靠性。

图二:不完整多视图数据不确定性量化框架概述
在 ADE20K、Caltech101-7、MSRC-v1 等多模态数据集上,KPHD-Net 在各种噪声水平与缺失率条件下均表现出优异性能,分类准确率提升 5% 以上,聚类鲁棒性显著增强。该成果不仅为多视图学习提供了全新的不确定性量化框架,也为后续在医学影像、智能感知等领域的应用奠定了理论与方法基础。

图三:Caltech101-7 与 Caltech101-20 数据集上的多视图聚类结果 t-SNE 可视化。

图四:在不同高斯噪声水平下 ADE20K 实验分类结果汇总
本研究提出了 KPHD-Net,一种结合卡尔曼滤波、Proper Hölder 散度与主观逻辑的多视图学习框架,通过动态证据融合对分类与聚类进行不确定性量化;在 ADE20K、MSRC-v1、Caltech101-7/20 等数据集上,KPHD-Net 在各种噪声水平(σ²=0.03)及缺失率条件下均显著优于现有方法,保持了高准确率与稳定性;此外,无论选用 ResNet50、DenseNet、Mamba 还是 ViT 等主干网络,均展现出稳定且优异的性能提升,充分证明其通用性与可靠性。该成果不仅为多视图学习构建了全新的不确定性量化框架,更为医学影像智能分析、智能感知等前沿领域的应用筑牢理论根基。未来,团队计划进一步优化模型,增强其在复杂场景下的适应性,拓展应用边界。
李春领衔的团队长期深耕学术研究与成果转化,聚焦医学影像、人工智能视觉技术、图形图像处理、机器学习等前沿方向,已在多项关键技术上取得突破,并积极推动科研成果向临床应用与产业实践转化,持续为相关领域发展注入创新动力。
论文链接:https://ieeexplore.ieee.org/document/11045813