論文の概要: D2C-SR: A Divergence to Convergence Approach for Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2103.14373v1
- Date: Fri, 26 Mar 2021 10:20:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 19:57:57.464570
- Title: D2C-SR: A Divergence to Convergence Approach for Image Super-Resolution
- Title(参考訳): D2C-SR:画像超解に対する収束アプローチの多様化
- Authors: Youwei Li, Haibin Huang, Lanpeng Jia, Haoqiang Fan and Shuaicheng Liu
- Abstract要約: 画像超解像(SR)のための新しいフレームワークD2C-SRを提案する。
SRFlowのような最近の作品に触発され、私たちはこの問題を半確率的に対処します。
実験により,PSNRおよびSSIMにおけるD2C-SRの性能は,計算コストが大幅に低減された。
- 参考スコア(独自算出の注目度): 25.17545119739454
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present D2C-SR, a novel framework for the task of image
super-resolution(SR). As an ill-posed problem, the key challenge for
super-resolution related tasks is there can be multiple predictions for a given
low-resolution input. Most classical methods and early deep learning based
approaches ignored this fundamental fact and modeled this problem as a
deterministic processing which often lead to unsatisfactory results. Inspired
by recent works like SRFlow, we tackle this problem in a semi-probabilistic
manner and propose a two-stage pipeline: a divergence stage is used to learn
the distribution of underlying high-resolution outputs in a discrete form, and
a convergence stage is followed to fuse the learned predictions into a final
output. More specifically, we propose a tree-based structure deep network,
where each branch is designed to learn a possible high-resolution prediction.
At the divergence stage, each branch is trained separately to fit ground truth,
and a triple loss is used to enforce the outputs from different branches
divergent. Subsequently, we add a fuse module to combine the multiple
predictions as the outputs from the first stage can be sub-optimal. The fuse
module can be trained to converge w.r.t the final high-resolution image in an
end-to-end manner. We conduct evaluations on several benchmarks, including a
new proposed dataset with 8x upscaling factor. Our experiments demonstrate that
D2C-SR can achieve state-of-the-art performance on PSNR and SSIM, with a
significantly less computational cost.
- Abstract(参考訳): 本稿では,画像超解像処理のための新しいフレームワークであるD2C-SRを提案する。
誤った問題として、超分解能関連タスクの鍵となる課題は、与えられた低分解能入力に対して複数の予測が可能であることである。
古典的手法と初期のディープラーニングに基づくアプローチは、この基本的な事実を無視し、この問題を決定論的処理としてモデル化し、しばしば不満足な結果をもたらす。
SRFlowのような最近の研究に触発されて、この問題を半確率的に解決し、2段階のパイプラインを提案する: 分散段階は、基礎となる高解像度出力の離散的な分布を学習するために使用され、収束段階は、学習した予測を最終出力に融合するために続く。
より具体的には、木構造深層ネットワークを提案し、各枝は高分解能予測を学習できるように設計されている。
発散段階では、各分岐は基底真理に適合するように個別に訓練され、異なる分岐からの出力を強制するために三重損失が使用される。
その後、第1段階からの出力が準最適となるため、複数の予測を組み合わせるヒューズモジュールを追加します。
ヒューズモジュールは最終高解像度画像をエンドツーエンドに収束するように訓練することができる。
8倍のアップスケーリング係数を持つ新しいデータセットを含む,いくつかのベンチマークで評価を行う。
実験により,PSNRおよびSSIMにおけるD2C-SRの性能は,計算コストが大幅に低減された。
関連論文リスト
- Latent Schrodinger Bridge: Prompting Latent Diffusion for Fast Unpaired Image-to-Image Translation [58.19676004192321]
ノイズからの画像生成とデータからの逆変換の両方を可能にする拡散モデル (DM) は、強力な未ペア画像対イメージ(I2I)翻訳アルゴリズムにインスピレーションを与えている。
我々は、最小輸送コストの分布間の微分方程式(SDE)であるSchrodinger Bridges (SBs) を用いてこの問題に取り組む。
この観測に触発されて,SB ODE を予め訓練した安定拡散により近似する潜在シュロディンガー橋 (LSB) を提案する。
提案アルゴリズムは,従来のDMのコストをわずかに抑えながら,教師なし環境での競合的I2I翻訳を実現していることを示す。
論文 参考訳(メタデータ) (2024-11-22T11:24:14Z) - Sparse Tensor PCA via Tensor Decomposition for Unsupervised Feature Selection [8.391109286933856]
パラメータ行列の投影方向を利用して教師なし特徴選択を行う2つのスパース主成分分析(STPCA)モデルを開発した。
両方のモデルに対して、各サブプロブレムの最適解がエルミート正正半定円錐(HPSD)に落ちることを証明する。
実験結果によると,提案手法は異なるデータテンソルシナリオの処理に適しており,最先端のUFS手法よりも優れていた。
論文 参考訳(メタデータ) (2024-07-24T04:04:56Z) - Successive Refinement in Large-Scale Computation: Advancing Model
Inference Applications [67.76749044675721]
階層化分解能計算の解を導入する。
これらの解により、最終結果よりも早い段階でより解像度の低い結果が得られる。
論文 参考訳(メタデータ) (2024-02-11T15:36:33Z) - End-to-end Alternating Optimization for Real-World Blind Super
Resolution [43.95832398891317]
Blind Super-Resolution (SR) は通常2つのサブプロブレムを含む。
与えられた低分解能(LR)画像の劣化を推定し、高分解能(HR)画像に超解凍する。
本稿では,SR画像の劣化と復元を1つのモデルで推定できる交互最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-17T06:55:09Z) - Dual-Diffusion: Dual Conditional Denoising Diffusion Probabilistic
Models for Blind Super-Resolution Reconstruction in RSIs [6.2678394285548755]
条件付きデノゲーション拡散確率モデル(DDPM)に基づく新しいブラインドSRフレームワークを提案する。
本研究では,カーネル推定の進展と再構築の進展という2つの側面から,条件付き分散確率モデル(DDPM)を導入する。
我々は、LR画像からHR画像へのマッピングを学習するためのDDPMベースの再構成器を構築する。
論文 参考訳(メタデータ) (2023-05-20T11:18:38Z) - Learning To Dive In Branch And Bound [95.13209326119153]
グラフニューラルネットワークを用いて特定の潜水構造を学習するためのL2Diveを提案する。
我々は、変数の割り当てを予測するために生成モデルを訓練し、線形プログラムの双対性を利用して潜水決定を行う。
論文 参考訳(メタデータ) (2023-01-24T12:01:45Z) - Scaling ResNets in the Large-depth Regime [11.374578778690623]
Deep ResNetは、機械学習タスクで最先端の結果を達成するために認識されている。
Deep ResNetsは、勾配の消滅や爆発を避けるために慎重に設計する必要があるトレーニング手順に依存している。
この問題を緩和する方法については合意が得られていないが、広く議論されている戦略は、各レイヤの出力を$alpha_L$でスケーリングすることである。
論文 参考訳(メタデータ) (2022-06-14T15:49:10Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - SRFlow: Learning the Super-Resolution Space with Normalizing Flow [176.07982398988747]
超解像度は、与えられた低解像度画像の複数の予測を可能にするため、不適切な問題である。
出力の条件分布を学習できる正規化フローベース超解法SRFlowを提案する。
我々のモデルは、単一損失、すなわち負のログ類似度を用いて、原則的に訓練されている。
論文 参考訳(メタデータ) (2020-06-25T06:34:04Z) - Simple and Effective Prevention of Mode Collapse in Deep One-Class
Classification [93.2334223970488]
深部SVDDにおける超球崩壊を防止するための2つの正則化器を提案する。
第1の正則化器は、標準のクロスエントロピー損失によるランダムノイズの注入に基づいている。
第2の正規化器は、小さすぎるとミニバッチ分散をペナライズする。
論文 参考訳(メタデータ) (2020-01-24T03:44:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。