論文の概要: DiffPR: Diffusion-Based Phase Reconstruction via Frequency-Decoupled Learning
- arxiv url: http://arxiv.org/abs/2506.11183v1
- Date: Thu, 12 Jun 2025 17:08:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.540737
- Title: DiffPR: Diffusion-Based Phase Reconstruction via Frequency-Decoupled Learning
- Title(参考訳): DiffPR:周波数分離学習による拡散に基づく位相再構成
- Authors: Yi Zhang,
- Abstract要約: オフアクシス定量的位相イメージング(QPI)に深層学習を適用する場合、過平滑化は持続的な問題である。
この問題をスペクトルバイアスに追従し、ハイレベルなスキップ接続によってバイアスが強化されていることを示す。
2段階の周波数分離フレームワークであるDiffPRを紹介する。
- 参考スコア(独自算出の注目度): 4.560284382063488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Oversmoothing remains a persistent problem when applying deep learning to off-axis quantitative phase imaging (QPI). End-to-end U-Nets favour low-frequency content and under-represent fine, diagnostic detail. We trace this issue to spectral bias and show that the bias is reinforced by high-level skip connections that feed high-frequency features directly into the decoder. Removing those deepest skips thus supervising the network only at a low resolution significantly improves generalisation and fidelity. Building on this insight, we introduce DiffPR, a two-stage frequency-decoupled framework. Stage 1: an asymmetric U-Net with cancelled high-frequency skips predicts a quarter-scale phase map from the interferogram, capturing reliable low-frequency structure while avoiding spectral bias. Stage 2: the upsampled prediction, lightly perturbed with Gaussian noise, is refined by an unconditional diffusion model that iteratively recovers the missing high-frequency residuals through reverse denoising. Experiments on four QPI datasets (B-Cell, WBC, HeLa, 3T3) show that DiffPR outperforms strong U-Net baselines, boosting PSNR by up to 1.1 dB and reducing MAE by 11 percent, while delivering markedly sharper membrane ridges and speckle patterns. The results demonstrate that cancelling high-level skips and delegating detail synthesis to a diffusion prior is an effective remedy for the spectral bias that limits conventional phase-retrieval networks.
- Abstract(参考訳): 深層学習を軸外定量的位相イメージング(QPI)に適用する場合、過度な平滑化は依然として持続的な問題である。
エンド・ツー・エンドのU-Netは低周波のコンテンツを好む。
この問題をスペクトルバイアスに追従し、デコーダに直接高周波特徴を供給する高レベルスキップ接続によってバイアスが強化されることを示す。
これらの深いスキップを除去することで、低解像度でのみネットワークを監視できるようになり、一般化と忠実度が大幅に向上する。
この知見に基づいて、2段階の周波数分離フレームワークであるDiffPRを紹介します。
ステージ1: キャンセルされた高周波スキップを持つ非対称U-Netは、インターフェログラムから4分の1の位相マップを予測し、スペクトルバイアスを回避しながら信頼性の高い低周波構造をキャプチャする。
ステージ2: ガウス雑音で軽く摂動されたアップサンプリング予測は、非条件拡散モデルにより洗練され、逆復調により欠落した高周波残差を反復的に回復する。
4つのQPIデータセット(B-Cell, WBC, HeLa, 3T3)の実験では、DiffPRは強いU-Netベースラインを上回り、PSNRが1.1dBまで上昇し、MAEが11%減少し、膜隆起とスペックルパターンが著しく鋭い。
その結果,従来の位相検索ネットワークを制限したスペクトルバイアスに対して,高レベルスキップをキャンセルし,詳細合成を拡散先行に委譲することが有効であることが示された。
関連論文リスト
- Adaptive Spectral Feature Forecasting for Diffusion Sampling Acceleration [58.19554276924402]
スペクトル拡散特徴予測器(Spectrum)を提案する。
我々はFLUX.1で4.79$times$スピードアップ、Wan2.1-14Bで4.67$times$スピードアップを達成する。
論文 参考訳(メタデータ) (2026-03-02T08:59:11Z) - Stabilizing Diffusion Posterior Sampling by Noise--Frequency Continuation [52.736416985173776]
高雑音下では、不正確な推定から計算されたデータ一貫性勾配は、後部幾何学と幾何的に一致しない。
本稿では、雑音依存周波数帯域内でのみ測定一貫性を強制する中間部分の連続的なファミリを構成するノイズ周波数継続フレームワークを提案する。
提案手法は最先端性能を実現し,強いベースライン上で最大5dBのPSNRの動作劣化を改善する。
論文 参考訳(メタデータ) (2026-01-30T03:14:01Z) - NFCDS: A Plug-and-Play Noise Frequency-Controlled Diffusion Sampling Strategy for Image Restoration [20.351955950047348]
拡散ベースのPlug-and-Play (NFC) 手法は高品質な画像を生成するが、しばしば忠実度が低下する。
逆拡散雑音の変調機構である周波数拡散型サンプリング(NFCDS)を提案する。
論文 参考訳(メタデータ) (2026-01-29T04:10:45Z) - FRAMER: Frequency-Aligned Self-Distillation with Adaptive Modulation Leveraging Diffusion Priors for Real-World Image Super-Resolution [6.767948729335409]
実像超解像(Real-ISR)は、混合された未知の劣化を伴うLR入力からHR画像の復元を目指している。
バックボーンや推論を変更せずに拡散先を利用するプラグイン・アンド・プレイのトレーニングスキームであるFRAMERを紹介する。
論文 参考訳(メタデータ) (2025-12-01T08:09:05Z) - Toward Diffusible High-Dimensional Latent Spaces: A Frequency Perspective [73.86108756585857]
我々は、エンコーダ/デコーダの動作を分析し、デコーダが詳細を回復するために高周波遅延成分に強く依存していることを確認する。
本稿ではFreqWarmについて紹介する。FreqWarmはプラグアンドプレイの周波数ウォームアップカリキュラムで、高周波潜時信号の早期露出を増大させる。
論文 参考訳(メタデータ) (2025-11-27T09:20:36Z) - SONAR: Spectral-Contrastive Audio Residuals for Generalizable Deepfake Detection [6.042897432654865]
Spectral-cONtrastive Audio Residuals (AR)は、ディープフェイクオーディオ検出器のための周波数誘導フレームワークである。
ARは音声信号を補完表現に切り離す。
ASVspoof 2021およびin-the-wildベンチマークで評価した。
論文 参考訳(メタデータ) (2025-11-26T12:16:38Z) - HDW-SR: High-Frequency Guided Diffusion Model based on Wavelet Decomposition for Image Super-Resolution [4.388490927225987]
ウェーブレット分解(HDW-SR)に基づく高周波誘導拡散ネットワークを提案する。
我々は残差マップのみに拡散を行い、ネットワークがより効率的に高周波情報復元に集中できるようにする。
合成データセットと実世界のデータセットの両方の実験は、HDW-SRが競合する超解像性能を達成することを示した。
論文 参考訳(メタデータ) (2025-11-17T09:25:26Z) - A Fourier Space Perspective on Diffusion Models [6.834230686279937]
拡散モデルは、画像、オーディオ、タンパク質、材料などのデータモダリティに関する最先端の生成モデルである。
フーリエ空間における拡散モデルの前方過程の帰納バイアスについて検討する。
論文 参考訳(メタデータ) (2025-05-16T14:13:02Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - High Frequency Matters: Uncertainty Guided Image Compression with Wavelet Diffusion [4.76749587454871]
ウェーブレット拡散(UGDiff)を用いた不確実性誘導画像圧縮手法を提案する。
本稿では,ウェーブレット変換による高周波圧縮に着目した。
2つのベンチマークデータセットに関する総合的な実験は、UGDiffの有効性を検証する。
論文 参考訳(メタデータ) (2024-07-17T13:21:31Z) - UDHF2-Net: Uncertainty-diffusion-model-based High-Frequency TransFormer Network for Remotely Sensed Imagery Interpretation [17.289252835606533]
不確実拡散モデルに基づく高周波トランスフォーマーネットワーク(UDHF2-Net)が最初に提案される。
UDHF2-Netは空間定常非定常高周波接続パラダイム(SHCP)である
Mask-and-geo-knowledge-based uncertainty diffusion module (MUDM) は自己指導型学習戦略である。
周波数ワイド半擬似半擬似UDHF2-Netは、変更検出の精度と複雑さのバランスをとるために提案された最初のものである。
論文 参考訳(メタデータ) (2024-06-23T15:03:35Z) - Frequency-Domain Refinement with Multiscale Diffusion for Super Resolution [7.29314801047906]
周波数領域誘導型マルチスケール拡散モデル(FDDiff)を提案する。
FDDiffは、高周波情報補完プロセスをよりきめ細かいステップに分解する。
FDDiffは高忠実度超解像率で先行生成法より優れていた。
論文 参考訳(メタデータ) (2024-05-16T11:58:52Z) - Denoising Diffusion Models for Plug-and-Play Image Restoration [135.6359475784627]
本稿では,従来のプラグアンドプレイ方式を拡散サンプリングフレームワークに統合したDiffPIRを提案する。
DiffPIRは、差別的なガウスのデノイザーに依存するプラグアンドプレイIR法と比較して、拡散モデルの生成能力を継承することが期待されている。
論文 参考訳(メタデータ) (2023-05-15T20:24:38Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Exploring Inter-frequency Guidance of Image for Lightweight Gaussian
Denoising [1.52292571922932]
本稿では,周波数帯域を低域から高域に漸進的に洗練するために,IGNetと呼ばれる新しいネットワークアーキテクチャを提案する。
この設計では、より周波数間先行と情報を利用するため、モデルサイズは軽量化でき、競争結果も維持できる。
論文 参考訳(メタデータ) (2021-12-22T10:35:53Z) - Hyperspectral Image Super-resolution via Deep Progressive Zero-centric
Residual Learning [62.52242684874278]
空間情報とスペクトル情報の相互モダリティ分布が問題となる。
本稿では,PZRes-Netという,新しいテクスライトウェイトなディープニューラルネットワークベースのフレームワークを提案する。
本フレームワークは,高分解能かつテクテッセロ中心の残像を学習し,シーンの空間的詳細を高頻度で表現する。
論文 参考訳(メタデータ) (2020-06-18T06:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。