令人兴奋的视频质量增强新研究!

我们很高兴地宣布,一篇题为「基于多尺度蒸馏的长短期融合屏幕内容视频质量增强」的开创性期刊论文将于2025年8月在《IEEE视频技术电路与系统学报》(TCSVT) 上发表。论文由本院与香港理工大学和钱塘高等研究院合作完成:

  • Huang, Y. -L. Chan, N. -W. Kwong, S. -H. Tsang, K. -M. Lam and W. -K. Ling, “Long Short-Term Fusion by Multi-Scale Distillation for Screen Content Video Quality Enhancement,” in IEEE Transactions on Circuits and Systems for Video Technology, vol. 35, no. 8, pp. 7762-7777, Aug. 2025, doi: 10.1109/TCSVT.2025.3544314.

论文链接:https://ieeexplore.ieee.org/document/10898056

论文摘要

本研究解决了压缩屏幕内容影片(例如网络研讨会或在线演示)中的一个常见问题:视频质量通常会因明显的失真而下降,尤其是在边缘和快速场景切换时。

传统方法难以有效改善这些视频质量,尤其是在场景切换突然的情况下。我们提出的解决方案引入了一种能够更好地应对这些挑战的新方法。

我们开发了两个独立的特征提取流:一个用于捕捉长期上下文,另一个用于关注短期细节。这种组合使系统能够有效地追踪快速运动和快速变化的场景。为了进一步提升这些过渡过程中的视频质量,我们添加了一个智能相邻帧选择器,用于识别最相关的帧以进行改进。

此外,我们的方法采用了一种称为多尺度特征蒸馏的技术,有助于细化和改进我们提取的重要特征。我们还创建了一个专门用于恢复高频细节的模块,确保精细的纹理和边缘清晰可见。

我们的实验结果表明,基于多尺度蒸馏的长短期融合 (LSFMD) 方法显著提升了压缩屏幕内容影片的质量,其性能优于现有的最先进技术。这项进步有望提升在线内容的观看体验,使用户能够享受更清晰、更愉悦的观看体验。

我们将继续与本地及大陆顶尖科研机构合作研发更先进的技术!

 

研究团队成员

香港珠海学院

曾锡豪博士,信息科学学系助理教授

香港理工大学

黄子茵博士,电机及电子工程学系博士

陈锐霖博士,电机及电子工程学系副教授

邝毅荣博士,电机及电子工程学系博士后研究员

林建文教授,电机及电子工程学系教授

钱塘高等研究院

凌永权教授,集成电路与人工智能中心教授

部分作者及论文照片

我们提出的 LSFMD 结构包含长短期特征萃取、多尺度分层特征蒸馏和高频重建。

与其他最先进的方法相比,我们的 LSFMD 具有更佳的视觉品质。 (原始影像:未压缩的原始影像)

ADMISSION