本网讯(通讯员:吴兴隆)近日,武汉工程大学计算机科学与工程学院、人工智能学院生物医学大数据团队在模式识别领域国际顶刊Pattern Recognition(中科院1区TOP期刊,影响因子8.0,DOI10.1016/j.patcog.2023.109819)发表题为“Haar wavelet downsampling: A simple but effective downsampling module for semantic segmentation“的研究论文。该研究受信息熵相关理论启发,针对目前主流的深度学习语义分割模型中下采样操作普遍面临的信息损失问题,提出一种全新的、基于Haar小波变换的无损下采样方法(HWD),首次实现了在尽可能保留特征变换图的全部特征信息的情况下空间分辨率减半的操作,有助于深度学习分割模型更高效的学习原始图像中的语义特征。
图1 |常见的下采样操作与本研究提出的基于小波变换的下采样方法之间的视觉效果对比
经过大量的实验证明,本研究提出的下采样新方法可以轻松的整合到目前主流的深度学习语义分割模型中,在多个公开及私有数据集中都获得分割性能的显著提升,且整体计算效率没有显著区别。此外,对采样后的特征图质量进行独立评估表明,相对于传统的下采样操作,本研究提出的无损下采样技术在分割模型中保留了目标物体的更多的上下文信息,从而间接证明了下采样操作中最大限度保留特征信息对于深度学习语义分割任务的重要性。
图2 |主流深度学习语义分割模型的效果展示:传统的下采用操作 vs. 本研究提出的下采样新方法
该论文是武汉工程大学为第一完成单位,徐国平博士为第一作者,吴兴隆博士为通讯作者。该研究工作得到了湖北省智能机器人重点实验室、华中科技大学武汉光电国家研究中心、广东省数字孪生人重点实验室等项目资助。
论文全文链接:
https://www.sciencedirect.com/science/article/pii/S0031320323005174
(审稿:张炜)