論文の概要: Trustworthy SR: Resolving Ambiguity in Image Super-resolution via
Diffusion Models and Human Feedback
- arxiv url: http://arxiv.org/abs/2402.07597v1
- Date: Mon, 12 Feb 2024 11:55:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 14:31:31.487632
- Title: Trustworthy SR: Resolving Ambiguity in Image Super-resolution via
Diffusion Models and Human Feedback
- Title(参考訳): 信頼できるSR:拡散モデルと人間のフィードバックによる画像超解像の曖昧性解消
- Authors: Cansu Korkmaz, Ege Cirakman, A. Murat Tekalp, Zafer Dogan
- Abstract要約: 超解像(英: Super- resolution, SR)は、与えられた低分解能画像と整合した大量の実現可能な解を持つ不測の逆問題である。
そこで我々は,被験者に少数のサンプルを選定するよう依頼し,選択したサンプルの平均をアンサンブルする。
提案手法は,最先端のSR手法と比較して信頼性の高いソリューションを提供する。
- 参考スコア(独自算出の注目度): 5.665865832321032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Super-resolution (SR) is an ill-posed inverse problem with a large set of
feasible solutions that are consistent with a given low-resolution image.
Various deterministic algorithms aim to find a single solution that balances
fidelity and perceptual quality; however, this trade-off often causes visual
artifacts that bring ambiguity in information-centric applications. On the
other hand, diffusion models (DMs) excel in generating a diverse set of
feasible SR images that span the solution space. The challenge is then how to
determine the most likely solution among this set in a trustworthy manner. We
observe that quantitative measures, such as PSNR, LPIPS, DISTS, are not
reliable indicators to resolve ambiguous cases. To this effect, we propose
employing human feedback, where we ask human subjects to select a small number
of likely samples and we ensemble the averages of selected samples. This
strategy leverages the high-quality image generation capabilities of DMs, while
recognizing the importance of obtaining a single trustworthy solution,
especially in use cases, such as identification of specific digits or letters,
where generating multiple feasible solutions may not lead to a reliable
outcome. Experimental results demonstrate that our proposed strategy provides
more trustworthy solutions when compared to state-of-the art SR methods.
- Abstract(参考訳): 超解像 (super- resolution, sr) は、与えられた低解像と整合する大きな解群を持つ逆問題である。
様々な決定論的アルゴリズムは、忠実さと知覚的品質のバランスをとる単一のソリューションを見つけることを目的としているが、このトレードオフはしばしば、情報中心のアプリケーションに曖昧さをもたらす視覚的アーティファクトを引き起こす。
一方、拡散モデル(DM)は、解空間にまたがる様々な実現可能なSR画像を生成するのに優れている。
課題は、このセットの中で最も可能性の高いソリューションを、信頼できる方法でどうやって決定するかである。
我々は,PSNR,LPIPS,disTSなどの定量的指標が,あいまいな症例を解決するための信頼性のある指標ではないことを観察した。
そこで本研究では, 被験者に対して, 少数のサンプルの選択を依頼し, 選択したサンプルの平均値をアンサンブルする手法を提案する。
この戦略は、DMの高品質な画像生成能力を活用し、特に特定の桁や文字の識別などのユースケースにおいて、単一の信頼できるソリューションを得ることの重要性を認識しながら、複数の実現可能なソリューションを生成することは、信頼性のある結果をもたらすことができない。
実験の結果,提案手法は最先端のSR手法と比較して信頼性の高い解を提供することがわかった。
関連論文リスト
- Learning from Multi-Perception Features for Real-Word Image
Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。
本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。
また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文 参考訳(メタデータ) (2023-05-26T07:35:49Z) - Perception-Distortion Trade-off in the SR Space Spanned by Flow Models [21.597478894658263]
フローベース生成超解法(SR)モデルは、SR空間と呼ばれる、実現可能なSRソリューションの多様なセットを生成することを学ぶ。
本稿では,ランダムなアーチファクトを排除し,知覚品質を著しく損なうことなく忠実さを向上する単一SR画像を得るための,単純だが効果的な画像アンサンブル/融合手法を提案する。
論文 参考訳(メタデータ) (2022-09-18T13:12:21Z) - Learning Resolution-Adaptive Representations for Cross-Resolution Person
Re-Identification [49.57112924976762]
低解像度(LR)クエリIDイメージと高解像度(HR)ギャラリーイメージとの整合性を実現する。
実際のカメラとの違いにより、クエリ画像が分解能の低下に悩まされることがしばしばあるため、これは困難かつ実用的な問題である。
本稿では,問合せ画像の解像度に適応する動的計量を用いて,HRとLRの画像を直接比較するためのSRフリーなパラダイムについて検討する。
論文 参考訳(メタデータ) (2022-07-09T03:49:51Z) - An Analysis of Generative Methods for Multiple Image Inpainting [4.234843176066354]
塗り絵は、観察者が検出できない方法で、欠落した領域のイメージを復元することを指す。
我々は,多彩なインペイントのための学習に基づく画像補完手法に着目する。
論文 参考訳(メタデータ) (2022-05-04T15:54:08Z) - Single Image Internal Distribution Measurement Using Non-Local
Variational Autoencoder [11.985083962982909]
本稿では,非局所変分オートエンコーダ(textttNLVAE)という画像固有解を提案する。
textttNLVAEは,非局所領域からの非絡み合った情報を用いて高解像度画像を再構成する自己教師型戦略として導入された。
7つのベンチマークデータセットによる実験結果から,textttNLVAEモデルの有効性が示された。
論文 参考訳(メタデータ) (2022-04-02T18:43:55Z) - HIME: Efficient Headshot Image Super-Resolution with Multiple Exemplars [11.81364643562714]
本稿では,HIME(Multiple Exemplars Network)法を用いた高効率なヘッドショット画像超解法を提案する。
従来の手法と比較して,我々のネットワークは入力と参照のミスアライメントを効果的に処理できる。
また、制御可能な空間範囲における局所的なテクスチャのリッチな表現を提供する相関損失を提案する。
論文 参考訳(メタデータ) (2022-03-28T16:13:28Z) - Deblurring via Stochastic Refinement [85.42730934561101]
条件付き拡散モデルに基づくブラインドデブロアリングのための代替フレームワークを提案する。
提案手法は,PSNRなどの歪み指標の点で競合する。
論文 参考訳(メタデータ) (2021-12-05T04:36:09Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - When Relation Networks meet GANs: Relation GANs with Triplet Loss [110.7572918636599]
GAN(Generative Adversarial Network)の学習安定性はいまだに悩みの種である
本稿では,判別器のための関係ネットワークアーキテクチャについて検討し,より優れた一般化と安定性を実現する三重項損失を設計する。
ベンチマークデータセットの実験により、提案された関係判別器と新たな損失は、可変視覚タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-02-24T11:35:28Z) - Cross-Resolution Adversarial Dual Network for Person Re-Identification
and Beyond [59.149653740463435]
人物再識別(re-ID)は、同一人物の画像をカメラビューでマッチングすることを目的としている。
カメラと関心のある人の距離が異なるため、解像度ミスマッチが期待できる。
本稿では,クロスレゾリューションな人物のリIDに対処する新たな生成的対向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T07:21:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。