論文の概要: Probabilistic Prior Driven Attention Mechanism Based on Diffusion Model for Imaging Through Atmospheric Turbulence
- arxiv url: http://arxiv.org/abs/2411.10321v1
- Date: Fri, 15 Nov 2024 16:22:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-18 15:38:03.213961
- Title: Probabilistic Prior Driven Attention Mechanism Based on Diffusion Model for Imaging Through Atmospheric Turbulence
- Title(参考訳): 拡散モデルに基づく大気乱流の可視化のための確率論的事前駆動型アテンション機構
- Authors: Guodong Sun, Qixiang Ma, Liqiang Zhang, Hongwei Wang, Zixuan Gao, Haotian Zhang,
- Abstract要約: 大気の乱流は、厳密な空間的および幾何学的な歪みをもたらし、従来の画像復元法に挑戦する。
本稿では,確率的拡散に基づく事前モデリングとトランスフォーマー駆動型特徴抽出を組み合わせた確率的事前乱流除去ネットワーク(PPTRN)を提案する。
PPTRNは、乱流劣化画像の復元品質を著しく改善し、明瞭度と構造的忠実度の新しいベンチマークを設定した。
- 参考スコア(独自算出の注目度): 8.442760236368692
- License:
- Abstract: Atmospheric turbulence introduces severe spatial and geometric distortions, challenging traditional image restoration methods. We propose the Probabilistic Prior Turbulence Removal Network (PPTRN), which combines probabilistic diffusion-based prior modeling with Transformer-driven feature extraction to address this issue. PPTRN employs a two-stage approach: first, a latent encoder and Transformer are jointly trained on clear images to establish robust feature representations. Then, a Denoising Diffusion Probabilistic Model (DDPM) models prior distributions over latent vectors, guiding the Transformer in capturing diverse feature variations essential for restoration. A key innovation in PPTRN is the Probabilistic Prior Driven Cross Attention mechanism, which integrates the DDPM-generated prior with feature embeddings to reduce artifacts and enhance spatial coherence. Extensive experiments validate that PPTRN significantly improves restoration quality on turbulence-degraded images, setting a new benchmark in clarity and structural fidelity.
- Abstract(参考訳): 大気の乱流は、厳密な空間的および幾何学的な歪みをもたらし、従来の画像復元法に挑戦する。
本稿では,確率的拡散に基づく事前モデリングとトランスフォーマー駆動型特徴抽出を組み合わせた確率的事前乱流除去ネットワーク(PPTRN)を提案する。
第一に、潜伏エンコーダとトランスフォーマーは、堅牢な特徴表現を確立するために、鮮明なイメージで共同で訓練される。
次に、Denoising Diffusion Probabilistic Model (DDPM) が遅延ベクトル上の事前分布をモデル化し、トランスフォーマーが復元に不可欠な多様な特徴を捉えるのを導く。
PPTRNにおける重要なイノベーションは、確率的事前駆動型クロスアテンションメカニズムである。これはDDPM生成前と機能埋め込みを統合し、アーティファクトを削減し、空間コヒーレンスを高める。
広範囲にわたる実験により、PTRNは乱流劣化画像の復元品質を著しく改善し、明瞭度と構造的忠実度に新たなベンチマークを設定した。
関連論文リスト
- Effective Diffusion Transformer Architecture for Image Super-Resolution [63.254644431016345]
画像超解像のための効果的な拡散変換器(DiT-SR)を設計する。
実際には、DiT-SRは全体のU字型アーキテクチャを活用し、すべての変圧器ブロックに対して均一な等方性設計を採用する。
我々は、広く使われているAdaLNの制限を分析し、周波数適応型時間-ステップ条件付けモジュールを提案する。
論文 参考訳(メタデータ) (2024-09-29T07:14:16Z) - Reconstructing Richtmyer-Meshkov instabilities from noisy radiographs using low dimensional features and attention-based neural networks [3.6270672925388263]
トレーニングされた注意に基づくトランスフォーマーネットワークは、Richtmyer-Meshkoff不安定性によって与えられる複雑なトポロジーを確実に回復することができる。
このアプローチは、ICFのような二重貝殻流体力学シミュレーションで実証される。
論文 参考訳(メタデータ) (2024-08-02T03:02:39Z) - HIR-Diff: Unsupervised Hyperspectral Image Restoration Via Improved
Diffusion Models [38.74983301496911]
ハイパースペクトル画像(HSI)の復元は、劣化した観察からクリーンなイメージを復元することを目的としている。
既存のモデルに基づく手法は、複雑な画像の特徴を正確にモデル化するのに限界がある。
本稿では,事前学習拡散モデル(HIR-Diff)を用いた教師なしHSI復元フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-24T17:15:05Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Reti-Diff: Illumination Degradation Image Restoration with Retinex-based
Latent Diffusion Model [59.08821399652483]
照明劣化画像復元(IDIR)技術は、劣化した画像の視認性を改善し、劣化した照明の悪影響を軽減することを目的としている。
これらのアルゴリズムのうち、拡散モデル(DM)に基づく手法は期待できる性能を示しているが、画像レベルの分布を予測する際に、重い計算要求や画素の不一致の問題に悩まされることが多い。
我々は、コンパクトな潜在空間内でDMを活用して、簡潔な指導先を生成することを提案し、IDIRタスクのためのReti-Diffと呼ばれる新しいソリューションを提案する。
Reti-Diff は Retinex-based Latent DM (RLDM) と Retinex-Guided Transformer (RG) の2つの鍵成分からなる。
論文 参考訳(メタデータ) (2023-11-20T09:55:06Z) - DiffSCI: Zero-Shot Snapshot Compressive Imaging via Iterative Spectral
Diffusion Model [18.25548360119976]
マルチスペクトル画像(MSI)におけるスナップショット圧縮画像(SCI)再構成の精度向上を目指した。
DiffSCIと呼ばれる新しいゼロショット拡散モデルを提案する。
我々は,DiffSCIが自己監督的,ゼロショット的アプローチよりも顕著な性能向上を示すことを示すため,広範囲な試験を行った。
論文 参考訳(メタデータ) (2023-11-19T20:27:14Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - ResDiff: Combining CNN and Diffusion Model for Image Super-Resolution [4.885537700693487]
ResDiffはSingle Image Super-Resolution (SISR)のための残差構造に基づく新しい拡散確率モデルである
MR画像を直接HR空間へ誘導する拡散に基づく一般的な手法とは対照的に、ResDiffはCNNの初期予測を利用してHR空間とCNN予測空間の間の残留空間へノイズを誘導する。
複数のベンチマークデータセットの実験により、ResDiffはモデル収束時間の短縮、生成品質の向上、より多様なサンプルの観点から、従来の拡散に基づく手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-03-15T15:50:11Z) - DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for
Hyperspectral Image Restoration [103.79030498369319]
ハイパースペクトル画像復元のための自己教師付き拡散モデルを提案する。
textttDDS2Mは、既存の拡散法と比較して、より強力な一般化能力を持っている。
HSIのノイズ除去、ノイズ除去、様々なHSIの超解像実験は、既存のタスク固有状態よりもtextttDDS2Mの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-03-12T14:57:04Z) - SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。
本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。
提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文 参考訳(メタデータ) (2022-06-09T14:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。