論文の概要: Explaining Image Enhancement Black-Box Methods through a Path Planning
Based Algorithm
- arxiv url: http://arxiv.org/abs/2207.07092v1
- Date: Thu, 14 Jul 2022 17:44:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-15 14:56:11.477570
- Title: Explaining Image Enhancement Black-Box Methods through a Path Planning
Based Algorithm
- Title(参考訳): 経路計画に基づくアルゴリズムによる画像強調ブラックボックス法の説明
- Authors: Marco Cotogni, Claudio Cusano
- Abstract要約: 本稿では,技術拡張手法の状態から生成した出力を段階的に説明する経路計画アルゴリズムを提案する。
eXIEと呼ばれるこのアルゴリズムは、A*アルゴリズムの変種を用いて、拡張演算子の等価シーケンスの適用を通じて、他のメソッドの拡張プロセスをエミュレートする。
- 参考スコア(独自算出の注目度): 5.617903764268157
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Nowadays, image-to-image translation methods, are the state of the art for
the enhancement of natural images. Even if they usually show high performance
in terms of accuracy, they often suffer from several limitations such as the
generation of artifacts and the scalability to high resolutions. Moreover,
their main drawback is the completely black-box approach that does not allow to
provide the final user with any insight about the enhancement processes
applied. In this paper we present a path planning algorithm which provides a
step-by-step explanation of the output produced by state of the art enhancement
methods, overcoming black-box limitation. This algorithm, called eXIE, uses a
variant of the A* algorithm to emulate the enhancement process of another
method through the application of an equivalent sequence of enhancing
operators. We applied eXIE to explain the output of several state-of-the-art
models trained on the Five-K dataset, obtaining sequences of enhancing
operators able to produce very similar results in terms of performance and
overcoming the huge limitation of poor interpretability of the best performing
algorithms.
- Abstract(参考訳): 現在、画像から画像への変換法は、自然画像の強化のための最先端技術である。
通常、精度で高いパフォーマンスを示すとしても、アーティファクトの生成や高解像度へのスケーラビリティといったいくつかの制限に悩まされることが多い。
さらに、その主な欠点は、適用された拡張プロセスに関する洞察を最終ユーザに提供することができない、完全にブラックボックスなアプローチである。
本稿では,ブラックボックス制限を克服し,アートエンハンスメント手法の状態によって生成された出力の段階的説明を行うパスプランニングアルゴリズムを提案する。
eXIEと呼ばれるこのアルゴリズムは、A*アルゴリズムの変種を用いて、拡張演算子の等価シーケンスの適用を通じて、他のメソッドの拡張プロセスをエミュレートする。
5kデータセットでトレーニングされた最先端モデルの出力を説明するためにexieを応用し、性能の面で非常に類似した結果が得られる拡張演算子のシーケンスを取得し、最善のアルゴリズムの解釈可能性の低さという膨大な制限を克服した。
関連論文リスト
- PnP-Flow: Plug-and-Play Image Restoration with Flow Matching [2.749898166276854]
本稿では,逆画像問題の解法であるPlug-and-Play Flow Matchingを提案する。
我々は,デノイング,スーパーレゾリューション,インペインティングのタスクにおける性能を評価した。
論文 参考訳(メタデータ) (2024-10-03T12:13:56Z) - SpotDiffusion: A Fast Approach For Seamless Panorama Generation Over Time [7.532695984765271]
生成モデルを用いて高解像度画像を生成する新しい手法を提案する。
提案手法は,時間とともに重なりのないデノベーションウィンドウをシフトさせ,一段階のシームが次回修正されるようにする。
提案手法は計算効率の向上や推論時間の高速化など,いくつかの重要な利点を提供する。
論文 参考訳(メタデータ) (2024-07-22T09:44:35Z) - Enhancing Image Layout Control with Loss-Guided Diffusion Models [0.0]
拡散モデルは単純なテキストプロンプトを用いて純粋なノイズから高品質な画像を生成する。
これらの手法のサブセットは、モデルの注意機構を利用しており、トレーニングフリーである。
本稿では,これらの手法を補完的な特徴を強調した解釈を行い,両手法がコンサートで使用される場合,優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2024-05-23T02:08:44Z) - ReNoise: Real Image Inversion Through Iterative Noising [62.96073631599749]
本研究では,操作数を増やすことなく,高い品質と操作率の逆転法を導入し,再現精度を向上する。
我々は,近年の高速化拡散モデルを含む様々なサンプリングアルゴリズムとモデルを用いて,Renoise手法の性能を評価する。
論文 参考訳(メタデータ) (2024-03-21T17:52:08Z) - Image Inpainting via Tractable Steering of Diffusion Models [54.13818673257381]
本稿では,トラクタブル確率モデル(TPM)の制約後部を正確に,かつ効率的に計算する能力を活用することを提案する。
具体的には、確率回路(PC)と呼ばれる表現型TPMのクラスを採用する。
提案手法は, 画像の全体的な品質とセマンティックコヒーレンスを, 計算オーバーヘッドを10%加えるだけで一貫的に改善できることを示す。
論文 参考訳(メタデータ) (2023-11-28T21:14:02Z) - CoDi: Conditional Diffusion Distillation for Higher-Fidelity and Faster
Image Generation [49.3016007471979]
大規模な生成拡散モデルは、テキスト・ツー・イメージ生成に革命をもたらし、条件付き生成タスクに大きな可能性を秘めている。
しかし、彼らの普及は高い計算コストによって妨げられ、リアルタイムの応用が制限される。
本稿では,事前学習した潜伏拡散モデルに付加的な画像条件入力を適応させるCoDiという新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T17:59:18Z) - Gradpaint: Gradient-Guided Inpainting with Diffusion Models [71.47496445507862]
Denoising Diffusion Probabilistic Models (DDPM) は近年,条件付きおよび非条件付き画像生成において顕著な成果を上げている。
我々はGradPaintを紹介し、グローバルな一貫性のあるイメージに向けて世代を操る。
我々は、様々なデータセットで訓練された拡散モデルによく適応し、現在最先端の教師付きおよび教師なしの手法を改善している。
論文 参考訳(メタデータ) (2023-09-18T09:36:24Z) - Towards Robust Image-in-Audio Deep Steganography [14.1081872409308]
本稿では,その堅牢性向上に焦点をあて,既存の音響深部ステガノグラフィー手法を拡張し,拡張する。
提案した機能拡張には、損失関数の修正、短い時間フーリエ変換(STFT)の利用、誤り訂正のための符号化プロセスにおける冗長性の導入、ピクセルサブ畳み込み操作における追加情報のバッファリングが含まれる。
論文 参考訳(メタデータ) (2023-03-09T03:16:04Z) - A Generic Approach for Enhancing GANs by Regularized Latent Optimization [79.00740660219256]
本稿では,事前学習したGANを効果的かつシームレスに拡張できる,エミュレーティブモデル推論と呼ばれる汎用フレームワークを提案する。
我々の基本的な考え方は、ワッサーシュタイン勾配流法を用いて与えられた要求に対する最適潜時分布を効率的に推算することである。
論文 参考訳(メタデータ) (2021-12-07T05:22:50Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。