VISR-CNN：基於多尺度傳輸注意力與頻譜門控的氣象能見度雙流預測框架

我們非常高興地宣佈，本團隊的最新研究論文《VISR-CNN: A Dual-Stream Framework for Meteorological Visibility Estimation via Multi-Scale Transmission Attention and Spectral Gating》已於 2026 年 5 月發表在國際權威期刊 MDPI《Algorithms》上。這項突破性成果是香港珠海學院、香港城市大學與香港教育大學之間又一次成功的跨校合作：

Wai Lun Lo, Kwok Wai Wong, Richard Tai Chiu Hsung, Henry Shu Hung Chung, Hong Fu, Harris Sik Ho Tsang, and Tony Yulin Zhu, “VISR-CNN: A Dual-Stream Framework for Meteorological Visibility Estimation via Multi-Scale Transmission Attention and Spectral Gating,” MDPI Algorithms, 19(6), 434, 2026, doi: 10.3390/a19060434.

論文連結： https://www.mdpi.com/1999-4893/19/6/434

摘要

準確的氣象能見度預測對於交通安全和環境監測至關重要。然而，在霧霾環境中對固有的非線性空間和光譜退化進行建模仍然具有挑戰性。儘管近期的大型視覺語言模型（LVLMs）提供了強大的場景理解能力，但它們缺乏能見度預測所需的回歸精度。在本文中，我們提出了「視覺感知優化卷積神經網絡（VISR-CNN）」，這是一種將局部空間特徵與全局頻域特徵相結合的雙流架構。該模型整合了「多尺度傳輸注意力（MSTA）」模組（利用平行空洞卷積來估計大氣傳輸），以及一個「全局頻率分支」（利用二維實數快速傅立葉變換（RFFT）與頻譜門控來量化與能見度相關的模糊效應）。我們引入了一種漸進式訓練策略來解耦頻譜和空間的最佳化，並設計了一個基於物理法則的損失函數來監督數值回歸，同時強制執行與物理光線衰減定律一致的單調排序約束。在 HKCHC-VD 數據集上的結果顯示，VISR-CNN 達到了最先進的效能（MAE：1.54 km；RMSE：2.31 km），比 VisNet 提升了 13.0%。在 CP1 和 SWH 數據集上的進一步評估證實了其強大的泛化能力，與混合 ResNeXt-50 + ViT 模型相比，整體 MAE 分別降低了 21% 和 20%。值得注意的是，在攸關安全的高危範圍（0–10 km）內，與 VisNet 相比，VISR-CNN 在 HKCHC-VD、CP1 和 SWH 數據集上的 RMSE 分別降低了約 55%、64% 和 71%。這些發現證明了在需要高精確度的氣象回歸任務中，具備物理基礎的專用架構優於通用的 LVLMs。

研究團隊成員

香港珠海學院