論文の概要: OL-DN: Online learning based dual-domain network for HEVC intra frame
quality enhancement
- arxiv url: http://arxiv.org/abs/2208.04661v1
- Date: Tue, 9 Aug 2022 11:06:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 13:02:45.090085
- Title: OL-DN: Online learning based dual-domain network for HEVC intra frame
quality enhancement
- Title(参考訳): OL-DN:HEVCフレーム内品質向上のためのオンライン学習に基づくデュアルドメインネットワーク
- Authors: Renwei Yang, Shuyuan Zhu, Xiaozhen Zheng, and Bing Zeng
- Abstract要約: 畳み込みニューラルネットワーク(CNN)に基づく手法は,圧縮画像とビデオの品質向上に有効なソリューションを提供する。
本稿では,HEVC内符号化画像の品質向上に生データを応用し,オンライン学習手法を提案する。
提案するオンライン学習ベースデュアルドメインネットワーク(OL-DN)は,最先端手法と比較して優れた性能を示した。
- 参考スコア(独自算出の注目度): 24.91807723834651
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolution neural network (CNN) based methods offer effective solutions for
enhancing the quality of compressed image and video. However, these methods
ignore using the raw data to enhance the quality. In this paper, we adopt the
raw data in the quality enhancement for the HEVC intra-coded image by proposing
an online learning-based method. When quality enhancement is demanded, we
online train our proposed model at encoder side and then use the parameters to
update the model of decoder side. This method not only improves model
performance, but also makes one model adoptable to multiple coding scenarios.
Besides, quantization error in discrete cosine transform (DCT) coefficients is
the root cause of various HEVC compression artifacts. Thus, we combine
frequency domain priors to assist image reconstruction. We design a DCT based
convolution layer, to produce DCT coefficients that are suitable for CNN
learning. Experimental results show that our proposed online learning based
dual-domain network (OL-DN) has achieved superior performance, compared with
the state-of-the-art methods.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)に基づく手法は,圧縮画像とビデオの品質向上に有効なソリューションを提供する。
しかし、これらの手法は品質を高めるために生データを無視する。
本稿では,HEVC内符号化画像の品質向上に生データを応用し,オンライン学習手法を提案する。
品質向上を要求された場合には,提案したモデルをエンコーダ側でオンライントレーニングし,パラメータを用いてデコーダ側のモデルを更新する。
この手法はモデルの性能を向上するだけでなく、複数のコーディングシナリオに1つのモデルを適用できるようにする。
さらに、離散コサイン変換(DCT)係数における量子化誤差は、様々なHEVC圧縮アーティファクトの根本原因である。
これにより、周波数領域プリエントを組み合わせて画像再構成を支援する。
我々は,CNN学習に適したDCT係数を生成するために,DCTに基づく畳み込み層を設計する。
実験結果から,提案したオンライン学習ベースデュアルドメインネットワーク(OL-DN)は,最先端手法と比較して優れた性能を示した。
関連論文リスト
- Transformer-based No-Reference Image Quality Assessment via Supervised
Contrastive Learning [36.695247860715874]
本稿では,新しいコントラスト学習 (Contrastive Learning, SCL) と NR-IQA モデル SaTQA を提案する。
まず、SCLによる大規模合成データセット上にモデルをトレーニングし、様々な歪みタイプとレベルの画像の劣化特徴を抽出する。
画像から歪み情報を抽出するために,CNNインダクティブバイアスとTransformerの長期依存性モデリング機能を組み合わせることで,マルチストリームブロック(MSB)を組み込んだバックボーンネットワークを提案する。
7つの標準IQAデータセットの実験結果から、SaTQAは合成データセットと認証データセットの両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-12-12T06:01:41Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - ConvNeXt-ChARM: ConvNeXt-based Transform for Efficient Neural Image
Compression [18.05997169440533]
ConvNeXt-ChARMは,効率的なConvNeXtベースのトランスフォーメーションコーディングフレームワークである。
ConvNeXt-ChARMは、VVC参照エンコーダ(VTM-18.0)と最先端の学習画像圧縮手法であるSwinT-ChARMに対して、平均5.24%と1.22%と、一貫したBDレート(PSNR)の低下をもたらすことを示した。
論文 参考訳(メタデータ) (2023-07-12T11:45:54Z) - Joint Hierarchical Priors and Adaptive Spatial Resolution for Efficient
Neural Image Compression [11.25130799452367]
ニューラル画像圧縮(NIC)のための絶対画像圧縮変換器(ICT)を提案する。
ICTは、潜在表現からグローバルコンテキストとローカルコンテキストの両方をキャプチャし、量子化された潜在表現の分布をパラメータ化する。
我々のフレームワークは、多目的ビデオ符号化(VVC)参照符号化(VTM-18.0)とニューラルスウィンT-ChARMに対する符号化効率とデコーダ複雑性のトレードオフを大幅に改善する。
論文 参考訳(メタデータ) (2023-07-05T13:17:14Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Rate Distortion Characteristic Modeling for Neural Image Compression [59.25700168404325]
エンドツーエンドの最適化機能は、ニューラルイメージ圧縮(NIC)の優れた損失圧縮性能を提供する。
異なるモデルは、R-D空間の異なる点に到達するために訓練される必要がある。
深層ネットワークと統計モデルを用いてNICのR-D挙動を記述するために,本質的な数学的関数の定式化に努めている。
論文 参考訳(メタデータ) (2021-06-24T12:23:05Z) - Super-Resolving Compressed Video in Coding Chain [27.994055823226848]
レファレンスベースのDCNNと連携する混合解像度符号化フレームワークを提案する。
この新しい符号化チェーンにおいて、基準ベースDCNNは、低解像度(LR)圧縮ビデオからデコーダ側の高解像度(HR)クリーンバージョンへの直接マッピングを学習する。
論文 参考訳(メタデータ) (2021-03-26T03:39:54Z) - Spatial Dependency Networks: Neural Layers for Improved Generative Image
Modeling [79.15521784128102]
画像生成装置(デコーダ)を構築するための新しいニューラルネットワークを導入し、可変オートエンコーダ(VAE)に適用する。
空間依存ネットワーク(sdns)では、ディープニューラルネットの各レベルにおける特徴マップを空間的にコヒーレントな方法で計算する。
空間依存層による階層型vaeのデコーダの強化は密度推定を大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-03-16T07:01:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。