論文の概要: I2I-PR: Deep Iterative Refinement for Phase Retrieval using Image-to-Image Diffusion Models
- arxiv url: http://arxiv.org/abs/2507.09609v1
- Date: Sun, 13 Jul 2025 12:26:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:23.580149
- Title: I2I-PR: Deep Iterative Refinement for Phase Retrieval using Image-to-Image Diffusion Models
- Title(参考訳): I2I-PR:画像と画像の拡散モデルを用いた位相検索のための深部反復再構成
- Authors: Mehmet Onurcan Kaya, Figen S. Oktem,
- Abstract要約: Inversion by Direct Iterationと呼ばれる画像と画像の拡散フレームワークに基づく新しい位相探索手法を提案する。
本手法は, トレーニング効率と再現性の両方において, 大幅な改善を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Phase retrieval involves recovering a signal from intensity-only measurements, crucial in many fields such as imaging, holography, optical computing, crystallography, and microscopy. Although there are several well-known phase retrieval algorithms, including classical iterative solvers, the reconstruction performance often remains sensitive to initialization and measurement noise. Recently, image-to-image diffusion models have gained traction in various image reconstruction tasks, yielding significant theoretical insights and practical breakthroughs. In this work, we introduce a novel phase retrieval approach based on an image-to-image diffusion framework called Inversion by Direct Iteration. Our method begins with an enhanced initialization stage that leverages a hybrid iterative technique, combining the Hybrid Input-Output and Error Reduction methods and incorporating a novel acceleration mechanism to obtain a robust crude estimate. Then, it iteratively refines this initial crude estimate using the learned image-to-image pipeline. Our method achieves substantial improvements in both training efficiency and reconstruction quality. Furthermore, our approach utilizes aggregation techniques to refine quality metrics and demonstrates superior results compared to both classical and contemporary techniques. This highlights its potential for effective and efficient phase retrieval across various applications.
- Abstract(参考訳): 位相検索は、画像、ホログラフィー、光学計算、結晶学、顕微鏡などの多くの分野において重要な強度のみの測定から信号を復元することを含む。
古典的反復解法を含むよく知られた位相探索アルゴリズムはいくつか存在するが、再構成性能は初期化や測定ノイズに敏感であることが多い。
近年,イメージ・ツー・イメージの拡散モデルが様々な画像再構成タスクで注目を集め,重要な理論的洞察と実用的なブレークスルーを生み出している。
そこで本研究では,直接反復によるインバージョン(Inversion by Direct Iteration)と呼ばれるイメージ・ツー・イメージ拡散フレームワークに基づく新しい位相探索手法を提案する。
提案手法は,ハイブリッドインプット・アウトプット法とエラー低減法を併用し,新しい加速機構を組み込むことにより,ロバストな粗推定値を得るハイブリッドイテレーティブ手法を活用する改良初期化段階から開始する。
そして、学習した画像と画像のパイプラインを用いて、この初期粗見積を反復的に洗練する。
本手法は, トレーニング効率と再現性の両方において, 大幅な改善を実現する。
さらに,本手法は集約手法を用いて品質指標を洗練し,古典的手法と現代的手法の双方と比較して優れた結果を示す。
このことは、様々なアプリケーションにまたがる効果的かつ効率的な位相検索の可能性を強調している。
関連論文リスト
- EchoIR: Advancing Image Restoration with Echo Upsampling and Bi-Level Optimization [0.0]
本稿では,このギャップを埋めるために,二つの学習可能なアップサンプリング機構を備えたUNetライクなイメージ復元ネットワークであるEchoIRを紹介する。
画像復元とアップサンプリングタスクの階層モデルの構築にあたり、近似二段階最適化(AS-BLO)を提案する。
論文 参考訳(メタデータ) (2024-12-10T06:27:08Z) - Deep Plug-and-Play HIO Approach for Phase Retrieval [0.0]
位相探索問題では、強度のみの測定から未知の画像の復元が目的である。
最近の学習に基づくアプローチは、いくつかの逆問題に対する分析手法の強力な代替手段として現れている。
学習に基づく事前かつ効率的な更新ステップを活用する,新しいプラグイン・アンド・プレイアプローチが紹介されている。
論文 参考訳(メタデータ) (2024-11-28T07:36:29Z) - Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration [59.744840744491945]
本稿では, この手法の軌道最適化を改良し, 復元品質と効率の両立に焦点をあてる。
反復サンプリングに伴うかなりの計算負担を軽減するため,コストを考慮したトラジェクトリー蒸留法を提案する。
提案アルゴリズムを用いて基礎拡散モデル(FLUX)を12Bパラメータで微調整し、7種類の画像復元タスクを処理する統一的なフレームワークを作成する。
論文 参考訳(メタデータ) (2024-10-07T07:46:08Z) - Effective Diffusion Transformer Architecture for Image Super-Resolution [63.254644431016345]
画像超解像のための効果的な拡散変換器(DiT-SR)を設計する。
実際には、DiT-SRは全体のU字型アーキテクチャを活用し、すべての変圧器ブロックに対して均一な等方性設計を採用する。
我々は、広く使われているAdaLNの制限を分析し、周波数適応型時間-ステップ条件付けモジュールを提案する。
論文 参考訳(メタデータ) (2024-09-29T07:14:16Z) - Multi-scale Conditional Generative Modeling for Microscopic Image Restoration [9.345394120765123]
ウェーブレット領域内でのブラウンブリッジプロセスの新たな活用により条件付き画像復元を促進するマルチスケール生成モデルを提案する。
提案手法は,SOTA拡散モデルに匹敵する画像生成品質と多様性を維持しつつ,トレーニングおよびサンプリング中に顕著な加速を提供する。
この先駆的な技術は、効率と品質を調和させる効率的な画像復元フレームワークを提供し、最先端の生成モデルを計算顕微鏡に組み込む際の大きな進歩を示している。
論文 参考訳(メタデータ) (2024-07-07T05:11:00Z) - ReNoise: Real Image Inversion Through Iterative Noising [62.96073631599749]
本研究では,操作数を増やすことなく,高い品質と操作率の逆転法を導入し,再現精度を向上する。
我々は,近年の高速化拡散モデルを含む様々なサンプリングアルゴリズムとモデルを用いて,Renoise手法の性能を評価する。
論文 参考訳(メタデータ) (2024-03-21T17:52:08Z) - IRGen: Generative Modeling for Image Retrieval [82.62022344988993]
本稿では,画像検索を生成モデルの一種として再フレーミングする新しい手法を提案する。
我々は、イメージを意味単位の簡潔なシーケンスに変換するという技術的課題に対処するため、IRGenと呼ばれるモデルを開発した。
本モデルは,広範に使用されている3つの画像検索ベンチマークと200万件のデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-17T17:07:36Z) - Multi-Channel Convolutional Analysis Operator Learning for Dual-Energy
CT Reconstruction [108.06731611196291]
我々は,多チャンネル畳み込み解析演算子学習法(MCAOL)を開発した。
本研究では,低エネルギー,高エネルギーで減衰画像を共同で再構成する最適化手法を提案する。
論文 参考訳(メタデータ) (2022-03-10T14:22:54Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。