論文の概要: Perceptual Learned Image Compression via End-to-End JND-Based
Optimization
- arxiv url: http://arxiv.org/abs/2402.02836v1
- Date: Mon, 5 Feb 2024 09:45:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 17:13:16.225801
- Title: Perceptual Learned Image Compression via End-to-End JND-Based
Optimization
- Title(参考訳): エンドツーエンドJND最適化による知覚学習画像圧縮
- Authors: Farhad Pakdaman, Sanaz Nami, and Moncef Gabbouj
- Abstract要約: Emerging Learned Image Compression (LC)は、圧縮のためのニューラルネットワークのエンドツーエンドトレーニングによって、コーディング効率を大幅に改善する。
HVS(Human Visual System)に準拠したLCの知覚的最適化は、まだ完全には検討されていない。
本稿では,Just Noticeable Distortion(JND)の原則をLCに統合するための新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 15.173265255635219
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emerging Learned image Compression (LC) achieves significant improvements in
coding efficiency by end-to-end training of neural networks for compression. An
important benefit of this approach over traditional codecs is that any
optimization criteria can be directly applied to the encoder-decoder networks
during training. Perceptual optimization of LC to comply with the Human Visual
System (HVS) is among such criteria, which has not been fully explored yet.
This paper addresses this gap by proposing a novel framework to integrate Just
Noticeable Distortion (JND) principles into LC. Leveraging existing JND
datasets, three perceptual optimization methods are proposed to integrate JND
into the LC training process: (1) Pixel-Wise JND Loss (PWL) prioritizes
pixel-by-pixel fidelity in reproducing JND characteristics, (2) Image-Wise JND
Loss (IWL) emphasizes on overall imperceptible degradation levels, and (3)
Feature-Wise JND Loss (FWL) aligns the reconstructed image features with
perceptually significant features. Experimental evaluations demonstrate the
effectiveness of JND integration, highlighting improvements in rate-distortion
performance and visual quality, compared to baseline methods. The proposed
methods add no extra complexity after training.
- Abstract(参考訳): Emerging Learned Image Compression (LC)は、圧縮のためのニューラルネットワークのエンドツーエンドトレーニングによって、コーディング効率を大幅に改善する。
従来のコーデックに対するこのアプローチの重要な利点は、トレーニング中に任意の最適化基準をエンコーダ-デコーダネットワークに直接適用できることである。
HVS(Human Visual System)に準拠したLCの知覚的最適化は、まだ完全には検討されていない。
本稿では、Just Noticeable Distortion(JND)の原則をLCに統合する新しいフレームワークを提案する。
既存のJNDデータセットを活用することで,JNDをLCトレーニングプロセスに統合する3つのパーセプティブ最適化手法が提案されている。(1) 画素単位のJND損失(PWL)は,JND特性の再現において画素単位の忠実度を優先し,(2) 画像単位のJND損失(IWL)は,全体的な知覚不能な劣化レベルを強調し,(3) 特徴単位のJND損失(FWL)は,再構成された画像特徴を知覚的に重要な特徴と整合させる。
実験により,JND統合の有効性が示され,ベースライン法と比較して,速度歪み性能と視覚的品質が向上した。
提案手法はトレーニング後の複雑さを増すことはない。
関連論文リスト
- Channel-wise Feature Decorrelation for Enhanced Learned Image Compression [16.638869231028437]
新たなLearnered Compression(LC)は、従来のモジュールをDeep Neural Networks(DNN)に置き換えるものだ。
本稿では,既存のDNN容量をフル活用して圧縮を改善することを提案する。
3つの戦略が提案され,(1)変換ネットワーク,(2)コンテキストモデル,(3)両ネットワークを最適化する。
論文 参考訳(メタデータ) (2024-03-16T14:30:25Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural
Image Compression [62.888755394395716]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - JND-Based Perceptual Optimization For Learned Image Compression [42.822121565430926]
学習画像圧縮方式におけるJNDに基づく知覚品質損失を提案する。
提案手法は,同じビットレートのベースラインモデルよりも知覚品質が向上したことを示す。
論文 参考訳(メタデータ) (2023-02-25T14:49:09Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Asymmetric Learned Image Compression with Multi-Scale Residual Block,
Importance Map, and Post-Quantization Filtering [15.056672221375104]
ディープラーニングに基づく画像圧縮は、最新のH.266/VVCよりも高いレート歪み(R-D)性能を実現している。
多くの先導的な学習スキームは、パフォーマンスと複雑さの間の良いトレードオフを維持することができません。
そこで本研究では,R-D の性能を技術状況よりも低い複雑さで実現した,効率的かつ効果的な画像符号化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T09:34:29Z) - Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。
深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。
本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文 参考訳(メタデータ) (2022-06-06T13:28:15Z) - Low-light Image Enhancement by Retinex Based Algorithm Unrolling and
Adjustment [50.13230641857892]
本稿では,低照度画像強調(LIE)問題に対する新たなディープラーニングフレームワークを提案する。
提案フレームワークは,大域的明るさと局所的明るさ感度の両方を考慮したアルゴリズムアンロールと調整ネットワークに着想を得た分解ネットワークを含む。
一連の典型的なLIEデータセットの実験では,既存の手法と比較して,定量的かつ視覚的に,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-12T03:59:38Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Generalized Octave Convolutions for Learned Multi-Frequency Image
Compression [20.504561050200365]
本稿では,初めて学習されたマルチ周波数画像圧縮とエントロピー符号化手法を提案する。
これは最近開発されたオクターブの畳み込みに基づいて、潜水剤を高周波(高分解能)成分に分解する。
提案した一般化オクターブ畳み込みは、他のオートエンコーダベースのコンピュータビジョンタスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-02-24T01:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。