我們很高興地宣布,一篇題為「基於多尺度蒸餾的長短期融合螢幕內容視訊品質增強」的開創性期刊論文將於2025年8月在《IEEE視訊技術電路與系統學報》(TCSVT) 上發表。論文由本院與香港理工大學和錢塘高等研究院合作完成:
- Huang, Y. -L. Chan, N. -W. Kwong, S. -H. Tsang, K. -M. Lam and W. -K. Ling, “Long Short-Term Fusion by Multi-Scale Distillation for Screen Content Video Quality Enhancement,” in IEEE Transactions on Circuits and Systems for Video Technology, vol. 35, no. 8, pp. 7762-7777, Aug. 2025, doi: 10.1109/TCSVT.2025.3544314.
論文連結:https://ieeexplore.ieee.org/document/10898056
論文摘要
本研究解決了壓縮螢幕內容影片(例如網路研討會或線上演示)中的一個常見問題:視訊品質通常會因明顯的失真而下降,尤其是在邊緣和快速場景切換時。
傳統方法難以有效改善這些視訊質量,尤其是在場景切換突然的情況下。我們提出的解決方案引入了一種能夠更好地應對這些挑戰的新方法。
我們開發了兩個獨立的特徵提取流:一個用於捕捉長期上下文,另一個用於關注短期細節。這種組合使系統能夠有效地追蹤快速運動和快速變化的場景。為了進一步提升這些過渡過程中的視訊質量,我們添加了一個智慧相鄰幀選擇器,用於識別最相關的幀以進行改進。
此外,我們的方法採用了一種稱為多尺度特徵蒸餾的技術,有助於細化和改進我們提取的重要特徵。我們還創建了一個專門用於恢復高頻細節的模組,確保精細的紋理和邊緣清晰可見。
我們的實驗結果表明,基於多尺度蒸餾的長短期融合 (LSFMD) 方法顯著提升了壓縮螢幕內容影片的質量,其性能優於現有的最先進技術。這項進步有望提升線上內容的觀看體驗,使用戶能夠享受更清晰、更愉悅的觀看體驗。
我們將繼續與本地及大陸頂尖科研機構合作研發更先進的技術!
研究團隊成員
香港珠海學院
曾錫豪博士,資訊科學學系助理教授
香港理工大學
黃子茵博士,電機及電子工程學系博士
陳銳霖博士,電機及電子工程學系副教授
鄺毅榮博士,電機及電子工程學系博士後研究員
林建文教授,電機及電子工程學系教授
錢塘高等研究院
凌永權教授,集成電路與人工智能中心教授
部分作者及论文照片
我們提出的 LSFMD 結構包含長短期特徵萃取、多尺度分層特徵蒸餾和高頻重建。
與其他最先進的方法相比,我們的 LSFMD 具有更佳的視覺品質。 (原始影像:未壓縮的原始影像)