論文の概要: DiffPR: Diffusion-Based Phase Reconstruction via Frequency-Decoupled Learning
- arxiv url: http://arxiv.org/abs/2506.11183v1
- Date: Thu, 12 Jun 2025 17:08:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.540737
- Title: DiffPR: Diffusion-Based Phase Reconstruction via Frequency-Decoupled Learning
- Title(参考訳): DiffPR:周波数分離学習による拡散に基づく位相再構成
- Authors: Yi Zhang,
- Abstract要約: オフアクシス定量的位相イメージング(QPI)に深層学習を適用する場合、過平滑化は持続的な問題である。
この問題をスペクトルバイアスに追従し、ハイレベルなスキップ接続によってバイアスが強化されていることを示す。
2段階の周波数分離フレームワークであるDiffPRを紹介する。
- 参考スコア(独自算出の注目度): 4.560284382063488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Oversmoothing remains a persistent problem when applying deep learning to off-axis quantitative phase imaging (QPI). End-to-end U-Nets favour low-frequency content and under-represent fine, diagnostic detail. We trace this issue to spectral bias and show that the bias is reinforced by high-level skip connections that feed high-frequency features directly into the decoder. Removing those deepest skips thus supervising the network only at a low resolution significantly improves generalisation and fidelity. Building on this insight, we introduce DiffPR, a two-stage frequency-decoupled framework. Stage 1: an asymmetric U-Net with cancelled high-frequency skips predicts a quarter-scale phase map from the interferogram, capturing reliable low-frequency structure while avoiding spectral bias. Stage 2: the upsampled prediction, lightly perturbed with Gaussian noise, is refined by an unconditional diffusion model that iteratively recovers the missing high-frequency residuals through reverse denoising. Experiments on four QPI datasets (B-Cell, WBC, HeLa, 3T3) show that DiffPR outperforms strong U-Net baselines, boosting PSNR by up to 1.1 dB and reducing MAE by 11 percent, while delivering markedly sharper membrane ridges and speckle patterns. The results demonstrate that cancelling high-level skips and delegating detail synthesis to a diffusion prior is an effective remedy for the spectral bias that limits conventional phase-retrieval networks.
- Abstract(参考訳): 深層学習を軸外定量的位相イメージング(QPI)に適用する場合、過度な平滑化は依然として持続的な問題である。
エンド・ツー・エンドのU-Netは低周波のコンテンツを好む。
この問題をスペクトルバイアスに追従し、デコーダに直接高周波特徴を供給する高レベルスキップ接続によってバイアスが強化されることを示す。
これらの深いスキップを除去することで、低解像度でのみネットワークを監視できるようになり、一般化と忠実度が大幅に向上する。
この知見に基づいて、2段階の周波数分離フレームワークであるDiffPRを紹介します。
ステージ1: キャンセルされた高周波スキップを持つ非対称U-Netは、インターフェログラムから4分の1の位相マップを予測し、スペクトルバイアスを回避しながら信頼性の高い低周波構造をキャプチャする。
ステージ2: ガウス雑音で軽く摂動されたアップサンプリング予測は、非条件拡散モデルにより洗練され、逆復調により欠落した高周波残差を反復的に回復する。
4つのQPIデータセット(B-Cell, WBC, HeLa, 3T3)の実験では、DiffPRは強いU-Netベースラインを上回り、PSNRが1.1dBまで上昇し、MAEが11%減少し、膜隆起とスペックルパターンが著しく鋭い。
その結果,従来の位相検索ネットワークを制限したスペクトルバイアスに対して,高レベルスキップをキャンセルし,詳細合成を拡散先行に委譲することが有効であることが示された。
関連論文リスト
- FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion [4.76749587454871]
ウェーブレット拡散(UGDiff)を用いた不確実性誘導画像圧縮手法を提案する。
本稿では,ウェーブレット変換による高周波圧縮に着目した。
2つのベンチマークデータセットに関する総合的な実験は、UGDiffの有効性を検証する。
論文 参考訳(メタデータ) (2024-07-17T13:21:31Z) - UDHF2-Net: Uncertainty-diffusion-model-based High-Frequency TransFormer Network for Remotely Sensed Imagery Interpretation [17.289252835606533]
不確実拡散モデルに基づく高周波トランスフォーマーネットワーク(UDHF2-Net)が最初に提案される。
UDHF2-Netは空間定常非定常高周波接続パラダイム(SHCP)である
Mask-and-geo-knowledge-based uncertainty diffusion module (MUDM) は自己指導型学習戦略である。
周波数ワイド半擬似半擬似UDHF2-Netは、変更検出の精度と複雑さのバランスをとるために提案された最初のものである。
論文 参考訳(メタデータ) (2024-06-23T15:03:35Z) - Denoising Diffusion Models for Plug-and-Play Image Restoration [135.6359475784627]
本稿では,従来のプラグアンドプレイ方式を拡散サンプリングフレームワークに統合したDiffPIRを提案する。
DiffPIRは、差別的なガウスのデノイザーに依存するプラグアンドプレイIR法と比較して、拡散モデルの生成能力を継承することが期待されている。
論文 参考訳(メタデータ) (2023-05-15T20:24:38Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。