VISR-CNN：基于多尺度传输注意力与频谱门控的气象能见度双流预测框架

我们非常高兴地宣布，本团队的最新研究论文《VISR-CNN: A Dual-Stream Framework for Meteorological Visibility Estimation via Multi-Scale Transmission Attention and Spectral Gating》已于 2026 年 5 月发表在国际权威期刊 MDPI《Algorithms》上。这项突破性成果是香港珠海学院、香港城市大学与香港教育大学之间又一次成功的跨校合作：

Wai Lun Lo, Kwok Wai Wong, Richard Tai Chiu Hsung, Henry Shu Hung Chung, Hong Fu, Harris Sik Ho Tsang, and Tony Yulin Zhu, “VISR-CNN: A Dual-Stream Framework for Meteorological Visibility Estimation via Multi-Scale Transmission Attention and Spectral Gating,” MDPI Algorithms, 19(6), 434, 2026, doi: 10.3390/a19060434.

论文链接： https://www.mdpi.com/1999-4893/19/6/434

摘要

准确的气象能见度预测对于交通安全和环境监测至关重要。然而，在雾霾环境中对固有的非线性空间和光谱退化进行建模仍然具有挑战性。尽管近期的大型视觉语言模型（LVLMs）提供了强大的场景理解能力，但它们缺乏能见度预测所需的回归精度。在本文中，我们提出了“视觉感知优化卷积神经网络（VISR-CNN）”，这是一种将局部空间特征与全局频域特征相结合的双流架构。该模型整合了“多尺度传输注意力（MSTA）”模块（利用并行空洞卷积来估计大气传输），以及一个“全局频率分支”（利用二维实数快速傅里叶变换（RFFT）与频谱门控来量化与能见度相关的模糊效应）。我们引入了一种渐进式训练策略来解耦频谱和空间的优化，并设计了一个基于物理法则的损失函数来监督数值回归，同时强制执行与物理光线衰减定律一致的单调排序约束。在 HKCHC-VD 数据集上的结果显示，VISR-CNN 达到了最先进的性能（MAE：1.54 km；RMSE：2.31 km），比 VisNet 提升了 13.0%。在 CP1 和 SWH 数据集上的进一步评估证实了其强大的泛化能力，与混合 ResNeXt-50 + ViT 模型相比，整体 MAE 分别降低了 21% 和 20%。值得注意的是，在攸关安全的高危范围（0–10 km）内，与 VisNet 相比，VISR-CNN 在 HKCHC-VD、CP1 和 SWH 数据集上的 RMSE 分别降低了约 55%、64% 和 71%。这些发现证明了在需要高精确度的气象回归任务中，具备物理基础的专用架构优于通用的 LVLMs。

研究团队成员

香港珠海学院