論文の概要: Auto-Encoded Supervision for Perceptual Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2412.00124v1
- Date: Thu, 28 Nov 2024 11:19:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:42:56.062227
- Title: Auto-Encoded Supervision for Perceptual Image Super-Resolution
- Title(参考訳): 知覚的超解像のための自動符号化スーパービジョン
- Authors: MinKyu Lee, Sangeek Hyun, Woojin Jun, Jae-Pil Heo,
- Abstract要約: この研究は知覚超解像(SR)における忠実度目標に取り組む
GANベースのSRフレームワークにおけるピクセルレベルの$L_textp$損失の欠点に対処する。
- 参考スコア(独自算出の注目度): 17.718093866806548
- License:
- Abstract: This work tackles the fidelity objective in the perceptual super-resolution~(SR). Specifically, we address the shortcomings of pixel-level $L_\text{p}$ loss ($\mathcal{L}_\text{pix}$) in the GAN-based SR framework. Since $L_\text{pix}$ is known to have a trade-off relationship against perceptual quality, prior methods often multiply a small scale factor or utilize low-pass filters. However, this work shows that these circumventions fail to address the fundamental factor that induces blurring. Accordingly, we focus on two points: 1) precisely discriminating the subcomponent of $L_\text{pix}$ that contributes to blurring, and 2) only guiding based on the factor that is free from this trade-off relationship. We show that they can be achieved in a surprisingly simple manner, with an Auto-Encoder (AE) pretrained with $L_\text{pix}$. Accordingly, we propose the Auto-Encoded Supervision for Optimal Penalization loss ($L_\text{AESOP}$), a novel loss function that measures distance in the AE space, instead of the raw pixel space. Note that the AE space indicates the space after the decoder, not the bottleneck. By simply substituting $L_\text{pix}$ with $L_\text{AESOP}$, we can provide effective reconstruction guidance without compromising perceptual quality. Designed for simplicity, our method enables easy integration into existing SR frameworks. Experimental results verify that AESOP can lead to favorable results in the perceptual SR task.
- Abstract(参考訳): この研究は知覚超解像~(SR)における忠実度目標に取り組む。
具体的には、GANベースのSRフレームワークにおいて、ピクセルレベルの$L_\text{p}$ loss$\mathcal{L}_\text{pix}$)の欠点に対処する。
L_\text{pix}$は知覚品質とトレードオフ関係にあることが知られているので、以前の方法は小さなスケールファクタを乗算したり、低パスフィルタを利用することが多い。
しかし、この研究はこれらの回避策が、ぼやけを引き起こす基本的な要因に対処できないことを示している。
したがって、我々は2つの点に焦点をあてる。
1) ぼかしに寄与する$L_\text{pix}$のサブコンポーネントを正確に識別し、
2)このトレードオフ関係から解放される要因に基づいてのみ指針を導出すること。
L_\text{pix}$で事前トレーニングされたオートエンコーダ(AE)で、驚くほど単純な方法で実現可能であることを示す。
そこで本研究では,AE空間における距離を測定する新しい損失関数であるAuto-Encoded Supervision for Optimal Penalization Los(L_\text{AESOP}$)を提案する。
AE空間は、ボトルネックではなく、デコーダの後の空間を表すことに注意してください。
単に$L_\text{pix}$を$L_\text{AESOP}$に置換することで、知覚品質を損なうことなく効果的な再構築ガイダンスを提供できる。
シンプルに設計され,既存のSRフレームワークへの統合が容易になった。
実験結果から,AESOPが知覚SRタスクにおいて良好な結果をもたらすことが確認された。
関連論文リスト
- Two-Timescale Gradient Descent Ascent Algorithms for Nonconvex Minimax Optimization [77.3396841985172]
我々は、構造化された非極小最適化問題の解法として、2時間勾配上昇(TTGDA)を統一的に解析する。
我々の貢献はTTGDAアルゴリズムを設計することであり、設定を超えて効果的です。
論文 参考訳(メタデータ) (2024-08-21T20:14:54Z) - Learning Adversarial Low-rank Markov Decision Processes with Unknown
Transition and Full-information Feedback [30.23951525723659]
本研究は,全情報フィードバック設定において,逆向きに損失が変化する低ランクMDPについて検討する。
政策最適化に基づくアルゴリズムPOLOを提案し、$widetildeO(Kfrac56Afrac12dln (1+M)/ (1-gamma)2)$ regret guarantee。
論文 参考訳(メタデータ) (2023-11-14T03:12:43Z) - DiffIR: Efficient Diffusion Model for Image Restoration [108.82579440308267]
拡散モデル(DM)は、画像合成過程をデノナイジングネットワークのシーケンシャルな応用にモデル化することで、SOTA性能を達成した。
画像全体や特徴マップを推定する大規模なモデルで大規模なイテレーションを実行する従来のDMは、画像復元には非効率である。
本稿では、小型IR先行抽出ネットワーク(CPEN)、ダイナミックIR変換器(DIRformer)、デノナイズネットワーク(Denoising Network)からなるDiffIRを提案する。
論文 参考訳(メタデータ) (2023-03-16T16:47:14Z) - Learning sparse auto-encoders for green AI image coding [5.967279020820772]
本稿では,メモリフットプリントが小さく,計算能力の少ないCAEを用いた画像圧縮の損失問題に対処する。
制約付きアプローチと新しい構造化スパース学習手法を提案する。
実験結果から,$ell_1,1$制約は最も構造化された近位間隔を提供し,メモリと計算コストの低減を図っている。
論文 参考訳(メタデータ) (2022-09-09T06:31:46Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Revisiting L1 Loss in Super-Resolution: A Probabilistic View and Beyond [28.90772192259691]
不正な問題としての超分解能は、低分解能入力に対する多くの高分解能候補を持つ。
提案する目的関数は,すべての可算解に対する再構成誤差の期待値の最小化を目的とする。
論文 参考訳(メタデータ) (2022-01-25T04:04:44Z) - Federated Optimization of Smooth Loss Functions [35.944772011421264]
本研究では,連合学習フレームワークにおける経験的リスク最小化(ERM)について検討する。
本稿では,FedLRGDアルゴリズムを提案する。
提案手法は,不正確な勾配勾配勾配を用いてサーバのERM問題を解く。
論文 参考訳(メタデータ) (2022-01-06T07:40:51Z) - Contrastive Feature Loss for Image Prediction [55.373404869092866]
教師付き画像合成モデルのトレーニングでは、批評家は2つの画像を比較する必要がある。
本稿では,2つの画像間の類似度を測定するための情報理論に基づくアプローチを提案する。
この定式化により,L1損失の代替として,出力画像の知覚的リアリズムが向上することを示す。
論文 参考訳(メタデータ) (2021-11-12T20:39:52Z) - LAPAR: Linearly-Assembled Pixel-Adaptive Regression Network for Single
Image Super-Resolution and Beyond [75.37541439447314]
単一画像超解像(SISR)は、低解像度(LR)画像を高解像度(HR)バージョンにアップサンプリングする根本的な問題を扱う。
本稿では,線形組立画素適応回帰ネットワーク (LAPAR) を提案する。
論文 参考訳(メタデータ) (2021-05-21T15:47:18Z) - End-to-end Alternating Optimization for Blind Super Resolution [68.395664154041]
2段階の解決策は、2つの独立に訓練されたモデルを含む。
我々は、ボケカーネルを推定し、単一のモデルでSRイメージを復元することができる交互最適化アルゴリズムを採用しています。
我々のモデルは最先端の手法を大きく上回り、はるかに高速で視覚的に有利な結果が得られる。
論文 参考訳(メタデータ) (2021-05-14T15:05:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。