論文の概要: HLIC: Harmonizing Optimization Metrics in Learned Image Compression by
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2109.14863v1
- Date: Thu, 30 Sep 2021 06:01:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-02 04:11:25.079658
- Title: HLIC: Harmonizing Optimization Metrics in Learned Image Compression by
Reinforcement Learning
- Title(参考訳): HLIC:強化学習による学習画像圧縮における最適化基準の調和化
- Authors: Baocheng Sun, Meng Gu, Dailan He, Tongda Xu, Yan Wang, Hongwei Qin
- Abstract要約: ピーク信号対雑音比(PSNR)とマルチスケール構造類似度(MS-SSIM)は、最も人気のある評価指標である。
本稿では,強化学習によるオンライン損失関数適応を用いた学習画像圧縮(HLIC)における最適化指標の調和化を提案する。
- 参考スコア(独自算出の注目度): 5.943388055895372
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learned image compression is making good progress in recent years. Peak
signal-to-noise ratio (PSNR) and multi-scale structural similarity (MS-SSIM)
are the two most popular evaluation metrics. As different metrics only reflect
certain aspects of human perception, works in this field normally optimize two
models using PSNR and MS-SSIM as loss function separately, which is suboptimal
and makes it difficult to select the model with best visual quality or overall
performance. Towards solving this problem, we propose to Harmonize optimization
metrics in Learned Image Compression (HLIC) using online loss function
adaptation by reinforcement learning. By doing so, we are able to leverage the
advantages of both PSNR and MS-SSIM, achieving better visual quality and higher
VMAF score. To our knowledge, our work is the first to explore automatic loss
function adaptation for harmonizing optimization metrics in low level vision
tasks like learned image compression.
- Abstract(参考訳): 近年,画像圧縮の学習が進歩している。
ピーク信号対雑音比(PSNR)とマルチスケール構造類似度(MS-SSIM)は、最も人気のある評価指標である。
異なるメトリクスは人間の知覚の特定の側面のみを反映しているため、この分野での作業は通常、損失関数としてPSNRとMS-SSIMを使用して2つのモデルを最適化する。
本稿では,強化学習によるオンライン損失関数適応を用いた学習画像圧縮(hlic)における最適化指標の調和化を提案する。
これにより、PSNRとMS-SSIMの両方の利点を活用でき、視覚的品質の向上とVMAFスコアの向上を実現できます。
我々の知る限り、学習された画像圧縮のような低レベルの視覚タスクにおいて、最適化メトリクスを調和させるための自動損失関数適応を初めて検討する。
関連論文リスト
- Perceptual-Distortion Balanced Image Super-Resolution is a Multi-Objective Optimization Problem [23.833099288826045]
画素ベースの回帰損失を用いた単一画像超解法(SISR)モデルのトレーニングは、高い歪みメトリクススコアを得ることができる。
しかし、高周波の詳細の回復が不十分なため、しばしばぼやけた画像が生じる。
本稿では,Multi-Objective Optimization(MOO)をSISRモデルのトレーニングプロセスに組み込んで,知覚品質と歪みのバランスをとる手法を提案する。
論文 参考訳(メタデータ) (2024-09-05T02:14:04Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Gradient constrained sharpness-aware prompt learning for vision-language
models [99.74832984957025]
本稿では,視覚言語モデル(VLM)の一般化可能な即時学習における新たなトレードオフ問題を提案する。
最先端手法のロスランドスケープとSAMに基づくバニラシャープネス認識最小化法を解析することにより、トレードオフ性能は損失値と損失シャープネスの両方に相関していると結論付けた。
本稿では,GCSCoOp (Gradient Constrained Sharpness-Aware Context Optimization) と表記される,素早い学習のためのSAMベースの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-09-14T17:13:54Z) - JND-Based Perceptual Optimization For Learned Image Compression [42.822121565430926]
学習画像圧縮方式におけるJNDに基づく知覚品質損失を提案する。
提案手法は,同じビットレートのベースラインモデルよりも知覚品質が向上したことを示す。
論文 参考訳(メタデータ) (2023-02-25T14:49:09Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Perceptually Optimizing Deep Image Compression [53.705543593594285]
平均二乗誤差(MSE)と$ell_p$ノルムは、ニューラルネットワークの損失の測定で大きく支配されている。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
論文 参考訳(メタデータ) (2020-07-03T14:33:28Z) - Saliency Driven Perceptual Image Compression [6.201592931432016]
画像圧縮技術の性能評価にはMS-SSIMやPSNRなどの評価指標が不十分であることを示す。
画像圧縮に特有な知覚的類似性データに基づいて学習する新しい指標を提案する。
このモデルは視覚的に優れた画像を生成するだけでなく、その後のコンピュータビジョンタスクに優れた性能を与える。
論文 参考訳(メタデータ) (2020-02-12T13:43:17Z) - An End-to-End Joint Learning Scheme of Image Compression and Quality
Enhancement with Improved Entropy Minimization [43.878329556261924]
画像圧縮と品質向上のための新しい共同学習手法であるJointIQ-Netを提案する。
提案するJointIQ-Netには,画像圧縮サブネットワークと品質向上サブネットワークが組み合わさっていて,どちらもJointIQ-Net内でエンドツーエンドにトレーニングされている。
論文 参考訳(メタデータ) (2019-12-30T05:10:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。