Fugu-MT 論文翻訳(概要): Exploiting Diffusion Priors for All-in-One Image Restoration

論文の概要: Exploiting Diffusion Priors for All-in-One Image Restoration

arxiv url: http://arxiv.org/abs/2312.02197v2
Date: Mon, 25 Dec 2023 14:50:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-29 21:35:35.381373
Title: Exploiting Diffusion Priors for All-in-One Image Restoration
Title（参考訳）: オールインワン画像復元のための拡散前処理
Authors: Yuanbiao Gou and Haiyu Zhao and Boyun Li and Xinyan Xiao and Xi Peng
Abstract要約: オールインワン画像復元は、画像復元の様々な課題を1つのモデルで解決することを目的としている。本稿では,事前訓練した拡散モデルにより得られた画像の先行画像を利用することが可能な方法を提案する。ゼロAIRと呼ばれるオールインワン画像復元のためのゼロショットフレームワークを提案する。
参考スコア（独自算出の注目度）: 38.56499144874893
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: All-in-one aims to solve various tasks of image restoration in a single model. To this end, we present a feasible way of exploiting the image priors captured by the pretrained diffusion model, through addressing the two challenges, i.e., degradation modeling and diffusion guidance. The former aims to simulate the process of the clean image degenerated by the unknown degradations, and the latter aims at guiding the diffusion model to generate the desired clean image. With the motivations, we propose a zero-shot framework for all-in-one image restoration, termed ZeroAIR, which alternatively performs the test-time degradation modeling (TDM) and the three-stage diffusion guidance (TDG) at each timestep of the reverse sampling. To be specific, TDM exploits the diffusion priors to learn a degradation model from a given degraded image, and TDG divides the timesteps into three stages for taking full advantages of the varying diffusion priors. Thanks to their degradation-agnostic property, all-in-one restoration could be achieved in a zero-shot way. Through extensive experiments, we show that our ZeroAIR achieves comparable even better performance than those task-specific methods. The code will be available on Github.
Abstract（参考訳）: All-in-oneは、画像復元の様々な課題を単一のモデルで解決することを目的としている。そこで本研究では,事前訓練した拡散モデルにより得られた画像の先行画像を利用して,劣化モデリングと拡散誘導という2つの課題に対処する方法を提案する。前者は未知の劣化によって生じるクリーン画像の過程をシミュレートすることを目的としており、後者は拡散モデルを導いて所望のクリーン画像を生成することを目的としている。そこで本研究では,ゼロエアと呼ばれるオールインワン画像復元のためのゼロショットフレームワークを提案し,逆サンプリングの各時間ステップでテスト時間分解モデル (tdm) と3段階拡散誘導 (tdg) を交互に実行する。具体的には、TDMは、所定の劣化画像から劣化モデルを学ぶために拡散前処理を利用し、TDGは、様々な拡散前処理を最大限に活用するために、時間ステップを3つのステージに分割する。劣化に依存しない性質により、オールインワンの復元はゼロショットで達成できる。広範な実験を通して、ZeroAIRはタスク固有のメソッドよりもパフォーマンスが優れていることを示す。コードはgithubで入手できる。

関連論文リスト

Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文参考訳（メタデータ） (2025-06-03T09:29:47Z)
Diffusion-Enhanced Test-time Adaptation with Text and Image Augmentation [67.37146712877794]
IT3Aは、未知の新しいドメインから各テストサンプルをマルチモーダル拡張するために、事前訓練された生成モデルを利用する新しいテスト時間適応手法である。事前学習された視覚と言語モデルからの強化されたデータを組み合わせることで、未知の新しいテストデータに適応するモデルの能力を高めることができる。ゼロショット設定では、IT3Aは5.50%の精度で最先端のテスト時間プロンプトチューニング手法より優れている。
論文参考訳（メタデータ） (2024-12-12T20:01:24Z)
Frequency-Guided Posterior Sampling for Diffusion-Based Image Restoration [32.50204554102937]
本稿では,既存の拡散型修復法に対する簡単な修正を提案する。本手法では,周波数領域における時間変化の少ない低域通過フィルタを提案する。本稿では,その基礎となるデータ分布に基づいて,この周波数スケジュールの適応カリキュラムを開発する。
論文参考訳（メタデータ） (2024-11-22T18:31:02Z)
DeepClean: Integrated Distortion Identification and Algorithm Selection for Rectifying Image Corruptions [1.8024397171920883]
画像歪みの自動分類と修正のための2段階逐次計画手法を提案する。提案手法の利点は、入力画像に条件付けされた動的再構成と、推論時に未確認候補アルゴリズムの一般化である。
論文参考訳（メタデータ） (2024-07-23T08:57:11Z)
Diffusion Model Driven Test-Time Image Adaptation for Robust Skin Lesion Classification [24.08402880603475]
テストデータ上でのモデルの精度を高めるためのテスト時間画像適応手法を提案する。拡散モデルを用いて、対象の試験画像をソース領域に投影して修正する。私たちの手法は、さまざまな汚職、アーキテクチャ、データレシエーションにおいて、堅牢性をより堅牢にします。
論文参考訳（メタデータ） (2024-05-18T13:28:51Z)
Forgery-aware Adaptive Transformer for Generalizable Synthetic Image Detection [106.39544368711427]
本研究では,様々な生成手法から偽画像を検出することを目的とした,一般化可能な合成画像検出の課題について検討する。本稿では,FatFormerという新しいフォージェリー適応トランスフォーマー手法を提案する。提案手法は, 平均98%の精度でGANを観測し, 95%の精度で拡散モデルを解析した。
論文参考訳（メタデータ） (2023-12-27T17:36:32Z)
Efficient Test-Time Adaptation for Super-Resolution with Second-Order Degradation and Reconstruction [62.955327005837475]
画像超解像(SR)は,低分解能(LR)から高分解能(HR)へのマッピングを,一対のHR-LRトレーニング画像を用いて学習することを目的としている。 SRTTAと呼ばれるSRの効率的なテスト時間適応フレームワークを提案し、SRモデルを異なる/未知の劣化型でテストドメインに迅速に適応させることができる。
論文参考訳（メタデータ） (2023-10-29T13:58:57Z)
Exploring Resolution and Degradation Clues as Self-supervised Signal for Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文参考訳（メタデータ） (2022-08-05T09:36:13Z)
Test-time Adaptation with Slot-Centric Models [63.981055778098444]
Slot-TTAは、半教師付きシーン分解モデルであり、シーンごとのテスト時間は、再構成やクロスビュー合成の目的に対する勾配降下を通じて適用される。我々は、最先端の監視フィードフォワード検出器と代替テスト時間適応法に対して、配電性能が大幅に向上したことを示す。
論文参考訳（メタデータ） (2022-03-21T17:59:50Z)
On-the-Fly Test-time Adaptation for Medical Image Segmentation [63.476899335138164]
ソースモデルをテスト時にターゲットデータに適応させることは、データシフト問題に対する効率的な解決策である。本稿では、各畳み込みブロックに適応バッチ正規化層を設けるAdaptive UNetという新しいフレームワークを提案する。テスト期間中、モデルは新しいテストイメージのみを取り込み、ドメインコードを生成して、テストデータに従ってソースモデルの特徴を適応させる。
論文参考訳（メタデータ） (2022-03-10T18:51:29Z)
A Hierarchical Transformation-Discriminating Generative Model for Few Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文参考訳（メタデータ） (2021-04-29T17:49:48Z)
Generative and Discriminative Learning for Distorted Image Restoration [22.230017059874445]
Liquifyは、画像の歪みに使用できる画像編集のテクニックである。本稿では,深層ニューラルネットワークに基づく新しい生成的・識別的学習手法を提案する。
論文参考訳（メタデータ） (2020-11-11T14:01:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。