我们很高兴地宣布,一篇题为「基于多尺度蒸馏的长短期融合屏幕内容视频质量增强」的开创性期刊论文将于2025年8月在《IEEE视频技术电路与系统学报》(TCSVT) 上发表。论文由本院与香港理工大学和钱塘高等研究院合作完成:
- Huang, Y. -L. Chan, N. -W. Kwong, S. -H. Tsang, K. -M. Lam and W. -K. Ling, “Long Short-Term Fusion by Multi-Scale Distillation for Screen Content Video Quality Enhancement,” in IEEE Transactions on Circuits and Systems for Video Technology, vol. 35, no. 8, pp. 7762-7777, Aug. 2025, doi: 10.1109/TCSVT.2025.3544314.
论文链接:https://ieeexplore.ieee.org/document/10898056
论文摘要
本研究解决了压缩屏幕内容影片(例如网络研讨会或在线演示)中的一个常见问题:视频质量通常会因明显的失真而下降,尤其是在边缘和快速场景切换时。
传统方法难以有效改善这些视频质量,尤其是在场景切换突然的情况下。我们提出的解决方案引入了一种能够更好地应对这些挑战的新方法。
我们开发了两个独立的特征提取流:一个用于捕捉长期上下文,另一个用于关注短期细节。这种组合使系统能够有效地追踪快速运动和快速变化的场景。为了进一步提升这些过渡过程中的视频质量,我们添加了一个智能相邻帧选择器,用于识别最相关的帧以进行改进。
此外,我们的方法采用了一种称为多尺度特征蒸馏的技术,有助于细化和改进我们提取的重要特征。我们还创建了一个专门用于恢复高频细节的模块,确保精细的纹理和边缘清晰可见。
我们的实验结果表明,基于多尺度蒸馏的长短期融合 (LSFMD) 方法显著提升了压缩屏幕内容影片的质量,其性能优于现有的最先进技术。这项进步有望提升在线内容的观看体验,使用户能够享受更清晰、更愉悦的观看体验。
我们将继续与本地及大陆顶尖科研机构合作研发更先进的技术!
研究团队成员
香港珠海学院
曾锡豪博士,信息科学学系助理教授
香港理工大学
黄子茵博士,电机及电子工程学系博士
陈锐霖博士,电机及电子工程学系副教授
邝毅荣博士,电机及电子工程学系博士后研究员
林建文教授,电机及电子工程学系教授
钱塘高等研究院
凌永权教授,集成电路与人工智能中心教授
部分作者及论文照片
我们提出的 LSFMD 结构包含长短期特征萃取、多尺度分层特征蒸馏和高频重建。
与其他最先进的方法相比,我们的 LSFMD 具有更佳的视觉品质。 (原始影像:未压缩的原始影像)