論文の概要: Multi-level Wavelet-based Generative Adversarial Network for Perceptual
Quality Enhancement of Compressed Video
- arxiv url: http://arxiv.org/abs/2008.00499v1
- Date: Sun, 2 Aug 2020 15:01:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 19:56:51.591294
- Title: Multi-level Wavelet-based Generative Adversarial Network for Perceptual
Quality Enhancement of Compressed Video
- Title(参考訳): 圧縮映像の知覚的品質向上のための多レベルウェーブレットベース生成逆ネットワーク
- Authors: Jianyi Wang, Xin Deng, Mai Xu, Congyong Chen, Yuhang Song
- Abstract要約: 既存の手法は主に、その知覚的品質を無視しながら、圧縮映像の客観的品質を高めることに焦点を当てている。
圧縮ビデオの知覚品質を高めるために,マルチレベルウェーブレットパケット変換(WPT)に基づくGAN(Generative Adversarial Network)を提案する。
- 参考スコア(独自算出の注目度): 51.631731922593225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The past few years have witnessed fast development in video quality
enhancement via deep learning. Existing methods mainly focus on enhancing the
objective quality of compressed video while ignoring its perceptual quality. In
this paper, we focus on enhancing the perceptual quality of compressed video.
Our main observation is that enhancing the perceptual quality mostly relies on
recovering high-frequency sub-bands in wavelet domain. Accordingly, we propose
a novel generative adversarial network (GAN) based on multi-level wavelet
packet transform (WPT) to enhance the perceptual quality of compressed video,
which is called multi-level wavelet-based GAN (MW-GAN). In MW-GAN, we first
apply motion compensation with a pyramid architecture to obtain temporal
information. Then, we propose a wavelet reconstruction network with
wavelet-dense residual blocks (WDRB) to recover the high-frequency details. In
addition, the adversarial loss of MW-GAN is added via WPT to further encourage
high-frequency details recovery for video frames. Experimental results
demonstrate the superiority of our method.
- Abstract(参考訳): 過去数年間、ディープラーニングによるビデオの品質向上が急速に進展している。
既存の手法は主に、その知覚的品質を無視しながら、圧縮映像の客観的品質を高めることに焦点を当てている。
本稿では,圧縮映像の知覚的品質の向上に着目する。
我々の観察では、知覚品質の向上は主にウェーブレット領域の高周波サブバンドの回復に依存している。
そこで本研究では,マルチレベルウェーブレットパケット変換 (wpt) に基づく新しい生成型逆ネットワーク (gan) を提案し,マルチレベルウェーブレットベースgan (mw-gan) と呼ばれる圧縮ビデオの知覚品質を向上させる。
MW-GANではまず,時間的情報を得るためにピラミッド構造を用いて動き補償を行う。
そこで本研究では,wavelet-dense residual blocks (wdrb) を用いたウェーブレット再構成ネットワークを提案する。
さらに、ビデオフレームの高頻度詳細回復を促進するため、WPTを介してMW-GANの対向損失を追加する。
実験の結果,本手法の優位性が示された。
関連論文リスト
- High-Frequency Enhanced Hybrid Neural Representation for Video Compression [32.38933743785333]
本稿では,高周波拡張型ハイブリッドニューラル表現ネットワークを提案する。
本手法は,ネットワークによる細部合成を改善するために,高周波情報を活用することに焦点を当てている。
BunnyおよびUVGデータセットの実験は、我々の手法が他の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-11-11T03:04:46Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Hierarchical Frequency-based Upsampling and Refining for Compressed Video Quality Enhancement [14.653248860008981]
圧縮ビデオ品質向上のための階層型周波数ベースアップサンプリング・精製ニューラルネットワーク(HFUR)を提案する。
ImpFreqUpは暗黙のDCT変換によって引き起こされたDCTドメインを利用して、粗い粒度転送によってDCTドメインの損失を正確に再構築する。
HIRを導入して、スケール間の相互協力と情報補償を容易にし、特徴マップをさらに洗練し、最終的な出力の視覚的品質を向上する。
論文 参考訳(メタデータ) (2024-03-18T08:13:26Z) - High Visual-Fidelity Learned Video Compression [6.609832462227998]
我々は,HVFVC(High Visual-Fidelity Learned Video Compression framework)を提案する。
具体的には,新たに出現した地域での貧弱な復興問題に対処するために,信頼度に基づく新しい特徴再構成手法を設計する。
広汎な実験により提案したHVFVCは、50%しか必要とせず、最新のVVC標準よりも優れた知覚品質が得られることが示された。
論文 参考訳(メタデータ) (2023-10-07T03:27:45Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - Boosting the Performance of Video Compression Artifact Reduction with
Reference Frame Proposals and Frequency Domain Information [31.053879834073502]
本稿では,既存のマルチフレーム手法の性能向上のための効果的な参照フレーム提案手法を提案する。
実験結果から,MFQE 2.0データセットの忠実度と知覚性能は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-05-31T13:46:11Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z) - An Emerging Coding Paradigm VCM: A Scalable Coding Approach Beyond
Feature and Signal [99.49099501559652]
Video Coding for Machine (VCM)は、視覚的特徴圧縮と古典的なビデオ符号化のギャップを埋めることを目的としている。
我々は,学習した動きパターンのガイダンスを用いて,映像フレームを再構成するために条件付き深層生成ネットワークを用いる。
予測モデルを介してスパース動作パターンを抽出することを学ぶことにより、特徴表現をエレガントに活用し、符号化されたフレームの外観を生成する。
論文 参考訳(メタデータ) (2020-01-09T14:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。