論文の概要: FCDM: Sparse-view Sinogram Inpainting with Frequency Domain Convolution Enhanced Diffusion Models
- arxiv url: http://arxiv.org/abs/2409.06714v1
- Date: Mon, 26 Aug 2024 12:31:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-09-15 05:21:30.433902
- Title: FCDM: Sparse-view Sinogram Inpainting with Frequency Domain Convolution Enhanced Diffusion Models
- Title(参考訳): 周波数領域畳み込み拡張拡散モデルによるSinogramのスパースビュー表示
- Authors: Jiaze E, Srutarshi Banerjee, Tekin Bicer, Guannan Wang, Bin Ren,
- Abstract要約: CT (Computed tomography) における放射線線量削減は重要であるが, しばしばスパルス・ビューCT (sparse-view CT) が生じる。
Sinogram inpaintingは、限られた投影で正確な画像再構成を可能にする。
従来のRGB画像でよく機能する既存のモデルは、シングラムの場合、ほとんど失敗する。
周波数畳み込み拡散モデル(FCDM)と呼ばれる新しいモデルを提案する。
周波数領域の畳み込みを用いて、様々な角度から周波数情報を抽出し、これらの角度間の複雑な関係を捉える。
- 参考スコア(独自算出の注目度): 8.057037609493824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reducing the radiation dose in computed tomography (CT) is crucial, but it often results in sparse-view CT, where the number of available projections is significantly reduced. This reduction in projection data makes it challenging to accurately reconstruct high-quality CT images. In this condition, a sinogram, which is a collection of these projections, becomes incomplete. Sinogram inpainting then becomes essential because it enables accurate image reconstruction with limited projections. Existing models performing well on conventional RGB images for inpainting mostly fail in the case of sinograms. Further, these models usually do not make full use of unique properties, e.g., frequency features and absorption characteristics in the sinogram, and cannot handle large-area masks and complex real-world projections well. To address these limitations, we propose a novel model called the Frequency Convolution Diffusion Model (FCDM). It employs frequency domain convolutions to extract frequency information from various angles and capture the intricate relationships between these angles, which is essential for high-quality CT reconstruction. We also design a specific loss function based on the unique properties of a sinogram to maintain the consistency in physical properties, which allows the model to learn more effectively even in larger mask areas. We compare FCDM using both simulations and real data with nine inpainting models examples, among which two are designed for sinogram and seven for RGB. The results indicate that our model significantly improves the quality of the inpainted sinograms in terms of both visually and quantitatively, with an SSIM of more than 0.95 and PSNR of more than 30, achieving up to a 33% improvement in SSIM and a 29% improvement in PSNR compared to the baseline.
- Abstract(参考訳): CT (Computed tomography) における放射線線量削減は重要であるが, しばしばスパルス・ビューCT (sparse-view CT) が生じる。
このプロジェクションデータの削減により、高品質なCT画像の正確な再構成が困難になる。
この条件下では、これらの射影の集合であるシングラムは不完全となる。
限られた投影で正確な画像再構成を可能にするため、シングラムの塗布が不可欠となる。
従来のRGB画像でよく機能する既存のモデルは、シングラムの場合、ほとんど失敗する。
さらに、これらのモデルは、通常、シングラムの周波数特性や吸収特性をフル活用せず、大面積のマスクや複雑な実世界の投影をうまく扱えない。
これらの制約に対処するため,周波数畳み込み拡散モデル (FCDM) と呼ばれる新しいモデルを提案する。
周波数領域の畳み込みを用いて、様々な角度から周波数情報を抽出し、これらの角度間の複雑な関係を捉える。
また、物理特性の整合性を維持するために、シングラムのユニークな性質に基づく特定の損失関数を設計し、より大きなマスク領域においてもより効果的に学習できるようにする。
シミュレーションと実データの両方を用いてFCDMを9つの塗り絵モデルで比較し,その内2つはシノグラム用、7つはRGB用である。
その結果,SSIMが0.95以上,PSNRが30以上,SSIMが33%,PSNRが29%であった。
関連論文リスト
- FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - CardiacMamba: A Multimodal RGB-RF Fusion Framework with State Space Models for Remote Physiological Measurement [24.511384674989223]
遠隔光麻痺(rPl)による心拍数(HR)推定は、健康モニタリングに非侵襲的な解決策を提供する。
従来の単一モダリティアプローチ(RGBまたはRF)は、照明のバリエーション、モーションアーティファクト、皮膚のトーンバイアスによるロバストさと精度のバランスをとる上で、課題に直面している。
両モードの相補的強度を利用するマルチモーダルRGB-RF融合フレームワークであるCardiacMambaを提案する。
論文 参考訳(メタデータ) (2025-02-19T11:00:34Z) - STAF: Sinusoidal Trainable Activation Functions for Implicit Neural Representation [7.2888019138115245]
Inlicit Neural Representations (INR) は、連続的な信号をモデリングするための強力なフレームワークとして登場した。
ReLUベースのネットワークのスペクトルバイアスは、十分に確立された制限であり、ターゲット信号の微細な詳細を捕捉する能力を制限する。
Sinusoidal Trainable Function Activation (STAF)について紹介する。
STAFは本質的に周波数成分を変調し、自己適応型スペクトル学習を可能にする。
論文 参考訳(メタデータ) (2025-02-02T18:29:33Z) - Physics-informed DeepCT: Sinogram Wavelet Decomposition Meets Masked Diffusion [9.126628956920904]
拡散モデルではスパース・ビュー・コンピュート・トモグラフィー(SVCT)の再建に有意な可能性がある。
SVCT再構成のためのSinogram-based Wavelet random decomposition and Random mask diffusion Model (SWARM)を提案する。
論文 参考訳(メタデータ) (2025-01-17T03:16:15Z) - Partitioned Hankel-based Diffusion Models for Few-shot Low-dose CT Reconstruction [10.158713017984345]
分割ハンケル拡散(PHD)モデルを用いた低用量CT再構成法を提案する。
反復再構成段階では、反復微分方程式解法とデータ一貫性制約を併用して、取得した投影データを更新する。
その結果,PHDモデルを画像品質を維持しつつ,アーチファクトやノイズを低減し,有効かつ実用的なモデルとして検証した。
論文 参考訳(メタデータ) (2024-05-27T13:44:53Z) - Taming Latent Diffusion Model for Neural Radiance Field Inpainting [63.297262813285265]
ニューラル・ラジアンス・フィールド(NeRF)は多視点画像からの3次元再構成の表現である。
本研究では,シーンごとのカスタマイズによる拡散モデルの傾向の緩和と,マスキングトレーニングによるテクスチャシフトの緩和を提案する。
我々のフレームワークは、様々な現実世界のシーンに最先端のNeRF塗装結果をもたらす。
論文 参考訳(メタデータ) (2024-04-15T17:59:57Z) - CVT-xRF: Contrastive In-Voxel Transformer for 3D Consistent Radiance Fields from Sparse Inputs [65.80187860906115]
スパース入力によるNeRFの性能向上のための新しい手法を提案する。
まず, サンプル線が, 3次元空間内の特定のボクセルと交差することを保証するために, ボクセルを用いた放射線サンプリング戦略を採用する。
次に、ボクセル内の追加点をランダムにサンプリングし、トランスフォーマーを適用して各線上の他の点の特性を推測し、ボリュームレンダリングに組み込む。
論文 参考訳(メタデータ) (2024-03-25T15:56:17Z) - Generalized Consistency Trajectory Models for Image Manipulation [59.576781858809355]
拡散モデル(DM)は、画像編集や復元などの応用と同様に、無条件生成において優れている。
本研究の目的は、一般化されたCTM(GCTM)を提案することによって、整合性軌道モデル(CTM)の完全なポテンシャルを解放することである。
本稿では,GCTMの設計空間について論じ,画像から画像への変換,復元,編集など,様々な画像操作タスクにおいて有効性を示す。
論文 参考訳(メタデータ) (2024-03-19T07:24:54Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Frequency Compensated Diffusion Model for Real-scene Dehazing [6.105813272271171]
本研究では,実ヘイズへの一般化を改善する条件付き拡散モデルに基づく脱ヘイズフレームワークについて考察する。
提案手法は, 実世界の画像において, 最先端の手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2023-08-21T06:50:44Z) - APRF: Anti-Aliasing Projection Representation Field for Inverse Problem
in Imaging [74.9262846410559]
Sparse-view Computed Tomography (SVCT) は画像の逆問題である。
近年の研究では、インプリシット・ニューラル・リ表現(INR)を用いて、シングラムとCT画像の座標に基づくマッピングを構築している。
自己教師型SVCT再構成法の提案 -抗エイリアス射影表現場(APRF)-
APRFは空間的制約によって隣接する投影ビュー間の連続的な表現を構築することができる。
論文 参考訳(メタデータ) (2023-07-11T14:04:12Z) - Geometric Constraints Enable Self-Supervised Sinogram Inpainting in
Sparse-View Tomography [7.416898042520079]
スパース角度トモグラフィースキャンは放射線を低減し、データ取得を加速するが、画像のアーチファクトやノイズに悩まされる。
既存の画像処理アルゴリズムはCT再構成の品質を復元することができるが、大きなトレーニングデータセットを必要とする場合が多い。
本研究は、勾配に基づく最適化により、欠落した射影ビューを最適化する自己教師付きプロジェクションインペインティング法を提案する。
論文 参考訳(メタデータ) (2023-02-13T15:15:18Z) - Orientation-Shared Convolution Representation for CT Metal Artifact
Learning [63.67718355820655]
X線CT(CT)スキャン中、患者を乗せた金属インプラントは、しばしば有害なアーティファクトに繋がる。
既存のディープラーニングベースの手法は、有望な再構築性能を得た。
本稿では,人工物の物理的事前構造に適応するために,配向型畳み込み表現戦略を提案する。
論文 参考訳(メタデータ) (2022-12-26T13:56:12Z) - One Sample Diffusion Model in Projection Domain for Low-Dose CT Imaging [10.797632196651731]
低線量CTは臨床応用における放射線リスクの低減に重要な役割を担っている。
ディープラーニングの急速な開発と幅広い応用により、低線量CTイメージングアルゴリズムの開発に向けた新たな方向性がもたらされた。
低用量CT再構成のための投影領域における完全に教師なし1サンプル拡散モデル(OSDM)を提案する。
以上の結果から,OSDMはアーティファクトを低減し,画像品質を維持するための実用的で効果的なモデルであることが証明された。
論文 参考訳(メタデータ) (2022-12-07T13:39:23Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - Self-Attention Generative Adversarial Network for Iterative
Reconstruction of CT Images [0.9208007322096533]
本研究の目的は、ノイズや不完全なデータから高品質なCT画像を再構成するために、単一のニューラルネットワークを訓練することである。
ネットワークには、データ内の長距離依存関係をモデル化するセルフアテンションブロックが含まれている。
我々のアプローチはCIRCLE GANに匹敵する全体的なパフォーマンスを示し、他の2つのアプローチよりも優れています。
論文 参考訳(メタデータ) (2021-12-23T19:20:38Z) - DuDoTrans: Dual-Domain Transformer Provides More Attention for Sinogram
Restoration in Sparse-View CT Reconstruction [13.358197688568463]
撮像過程におけるヨウ素の放射線は 不可逆的な損傷を引き起こす
スパースビューCT画像に現れるアーティファクトを緩和する反復モデルが提案されているが,コストが高すぎる。
textbfDual-textbfDomain textbfDuDoTransを提案する。
論文 参考訳(メタデータ) (2021-11-21T10:41:07Z) - CyTran: A Cycle-Consistent Transformer with Multi-Level Consistency for
Non-Contrast to Contrast CT Translation [56.622832383316215]
コントラストCTを非コントラストCTに変換する手法を提案する。
提案手法は、CyTranを略して、サイクル一貫性のある生成逆転変換器に基づいている。
実験の結果、CyTranは競合するすべての手法より優れています。
論文 参考訳(メタデータ) (2021-10-12T23:25:03Z) - Focal Frequency Loss for Image Reconstruction and Synthesis [125.7135706352493]
周波数領域の狭さが画像再構成と合成品質をさらに改善できることを示す。
本稿では,合成が難しい周波数成分に適応的に焦点を合わせることのできる,新しい焦点周波数損失を提案する。
論文 参考訳(メタデータ) (2020-12-23T17:32:04Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z) - Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion
Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。
SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。
また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文 参考訳(メタデータ) (2020-02-25T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。