論文の概要: Noise-free Optimization in Early Training Steps for Image
Super-Resolution
- arxiv url: http://arxiv.org/abs/2312.17526v1
- Date: Fri, 29 Dec 2023 09:13:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-02 10:14:59.547947
- Title: Noise-free Optimization in Early Training Steps for Image
Super-Resolution
- Title(参考訳): 画像超解像の初期訓練におけるノイズフリー最適化
- Authors: MinKyu Lee, Jae-Pil Heo
- Abstract要約: 本研究では,対象のHR画像を2つのサブコンポーネントに分解することで,基礎となる構成要素をよりよく理解することを目的とする。
本研究は, SISRの誤った性質を把握できないことを示唆するものである。
本研究では,バニラ訓練の初期段階において,固有雑音項を効果的に除去できる新しい最適化手法を提案する。
- 参考スコア(独自算出の注目度): 20.169700745745462
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recent deep-learning-based single image super-resolution (SISR) methods have
shown impressive performance whereas typical methods train their networks by
minimizing the pixel-wise distance with respect to a given high-resolution (HR)
image. However, despite the basic training scheme being the predominant choice,
its use in the context of ill-posed inverse problems has not been thoroughly
investigated. In this work, we aim to provide a better comprehension of the
underlying constituent by decomposing target HR images into two subcomponents:
(1) the optimal centroid which is the expectation over multiple potential HR
images, and (2) the inherent noise defined as the residual between the HR image
and the centroid. Our findings show that the current training scheme cannot
capture the ill-posed nature of SISR and becomes vulnerable to the inherent
noise term, especially during early training steps. To tackle this issue, we
propose a novel optimization method that can effectively remove the inherent
noise term in the early steps of vanilla training by estimating the optimal
centroid and directly optimizing toward the estimation. Experimental results
show that the proposed method can effectively enhance the stability of vanilla
training, leading to overall performance gain. Codes are available at
github.com/2minkyulee/ECO.
- Abstract(参考訳): 近年の深層学習に基づく単一画像超解像法(SISR)は,高分解能(HR)画像に対する画素幅の最小化により,ネットワークをトレーニングする典型的な手法である。
しかし, 基本訓練方式が主流であるにもかかわらず, 不正な逆問題の文脈での利用については, 十分に検討されていない。
本研究では,対象のHR画像から複数のHR画像に対する期待値である最適セントロイドと,HR画像とセントロイドの残差として定義される固有ノイズの2つのサブコンポーネントに分解することで,基礎となる構成成分をよりよく理解することを目的とする。
以上の結果から,現在のトレーニング手法ではSISRの不正な性質を捉えられず,特に早期訓練の段階では固有のノイズ項に弱いことが示唆された。
そこで本研究では,バニラ訓練の初期段階における固有雑音項を,最適な遠心率を推定し,直接的最適化を行うことで効果的に除去できる新しい最適化手法を提案する。
実験の結果,提案手法はバニラ訓練の安定性を効果的に向上し,全体の性能向上につながることが示された。
コードはgithub.com/2minkyulee/ECOで入手できる。
関連論文リスト
- AP-LDM: Attentive and Progressive Latent Diffusion Model for Training-Free High-Resolution Image Generation [12.564266865237343]
遅延拡散モデル(LDM)は、しばしば高分解能(HR)画像を直接生成する際に重要な構造歪みを経験する。
生成プロセスの高速化を図り,HR画像の品質向上を目的とした注意・進歩型LDM(Attentive and Progressive LDM)を提案する。
AP-LDM は LDM の分解過程を, (i) 注意的訓練分解性脱ノイズ, (ii) 進行性高分解能脱ノイズの2段階に分解する。
論文 参考訳(メタデータ) (2024-10-08T13:56:28Z) - Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration [59.744840744491945]
我々は, この手法の軌道最適化を再構築し, 復元品質と効率の両立に焦点をあてる。
本稿では,複雑な経路を適応可能なサイズで複数の管理可能なステップに合理化するためのコスト対応トラジェクトリー蒸留法を提案する。
実験では提案手法の有意な優位性を示し, 最先端手法よりも最大2.1dBのPSNR改善を実現した。
論文 参考訳(メタデータ) (2024-10-07T07:46:08Z) - One-step Generative Diffusion for Realistic Extreme Image Rescaling [47.89362819768323]
極端画像再スケーリングのためのワンステップイメージ再スケーリング拡散(OSIRDiff)と呼ばれる新しいフレームワークを提案する。
OSIRDiffは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を実行する。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-17T09:51:42Z) - Generalized Expectation Maximization Framework for Blind Image Super
Resolution [28.108363151431877]
視覚障害者のためのエンドツーエンド学習フレームワークを提案する。
提案手法は,一般予測最大化(GEM)アルゴリズムに学習手法を統合し,最大推定(MLE)からHR画像を推定する。
論文 参考訳(メタデータ) (2023-05-23T10:01:58Z) - Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。
深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。
本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文 参考訳(メタデータ) (2022-06-06T13:28:15Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - Deep Generative Adversarial Residual Convolutional Networks for
Real-World Super-Resolution [31.934084942626257]
我々は,超解像残差畳み込み生成共役ネットワーク(SRResCGAN)を提案する。
これは、生成したLRドメインからHRドメインの画素単位の監督でモデルを逆トレーニングすることで、現実世界の劣化設定に従う。
提案するネットワークは,画像の高精細化と凸最適化によるエネルギーベース目的関数の最小化により,残差学習を利用する。
論文 参考訳(メタデータ) (2020-05-03T00:12:38Z) - Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。
従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。
これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。
従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文 参考訳(メタデータ) (2019-12-30T16:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。