論文の概要: CTLformer: A Hybrid Denoising Model Combining Convolutional Layers and Self-Attention for Enhanced CT Image Reconstruction
- arxiv url: http://arxiv.org/abs/2505.12203v1
- Date: Sun, 18 May 2025 02:37:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.091051
- Title: CTLformer: A Hybrid Denoising Model Combining Convolutional Layers and Self-Attention for Enhanced CT Image Reconstruction
- Title(参考訳): CTLformer:CT画像再構成のための畳み込み層と自己注意を組み合わせたハイブリッドDenoising Model
- Authors: Zhiting Zheng, Shuqi Wu, Wen Ding,
- Abstract要約: 低線量CT(LDCT)画像は、しばしば大きなノイズを伴い、画像の品質とその後の診断精度に悪影響を及ぼす。
本稿では、畳み込み構造とトランスアーキテクチャを組み合わせた革新的なモデルCTLformerを紹介する。
マルチスケールアテンション機構とダイナミックアテンション制御機構の2つの重要な革新が提案されている。
- 参考スコア(独自算出の注目度): 0.21847754147782888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Low-dose CT (LDCT) images are often accompanied by significant noise, which negatively impacts image quality and subsequent diagnostic accuracy. To address the challenges of multi-scale feature fusion and diverse noise distribution patterns in LDCT denoising, this paper introduces an innovative model, CTLformer, which combines convolutional structures with transformer architecture. Two key innovations are proposed: a multi-scale attention mechanism and a dynamic attention control mechanism. The multi-scale attention mechanism, implemented through the Token2Token mechanism and self-attention interaction modules, effectively captures both fine details and global structures at different scales, enhancing relevant features and suppressing noise. The dynamic attention control mechanism adapts the attention distribution based on the noise characteristics of the input image, focusing on high-noise regions while preserving details in low-noise areas, thereby enhancing robustness and improving denoising performance. Furthermore, CTLformer integrates convolutional layers for efficient feature extraction and uses overlapping inference to mitigate boundary artifacts, further strengthening its denoising capability. Experimental results on the 2016 National Institutes of Health AAPM Mayo Clinic LDCT Challenge dataset demonstrate that CTLformer significantly outperforms existing methods in both denoising performance and model efficiency, greatly improving the quality of LDCT images. The proposed CTLformer not only provides an efficient solution for LDCT denoising but also shows broad potential in medical image analysis, especially for clinical applications dealing with complex noise patterns.
- Abstract(参考訳): 低線量CT(LDCT)画像は、しばしば大きなノイズを伴い、画像の品質とその後の診断精度に悪影響を及ぼす。
LDCTにおけるマルチスケール機能融合と多様なノイズ分布パターンの課題に対処するために,畳み込み構造と変圧器構造を組み合わせた革新的なモデルCTLformerを提案する。
マルチスケールアテンション機構とダイナミックアテンション制御機構の2つの重要な革新が提案されている。
Token2Token機構とセルフアテンション相互作用モジュールによって実装されたマルチスケールアテンション機構は、細部とグローバル構造の両方を異なるスケールで効果的に捕捉し、関連する機能を強化し、ノイズを抑制する。
ダイナミックアテンション制御機構は、入力画像のノイズ特性に基づいてアテンション分布を適応し、低ノイズ領域の詳細を保存しながらハイノイズ領域に着目し、ロバスト性を高め、デノイズ性能を向上させる。
さらに、CTLformerは効率的な特徴抽出のために畳み込み層を統合し、重複推論を使用して境界アーティファクトを緩和し、さらにデノナイジング能力を強化している。
2016年の国立衛生研究所マヨクリニックLDCTチャレンジデータセットの実験結果によると、CTLformerは性能とモデル効率の両方において既存の手法よりも優れており、LDCT画像の品質が大幅に向上している。
提案したCTLformer は,LDCT の難聴に対する効率的な解決策を提供するだけでなく,医用画像解析,特に複雑なノイズパターンを扱う臨床応用にも大きな可能性を示す。
関連論文リスト
- Multi-View Learning with Context-Guided Receptance for Image Denoising [18.175992709188026]
写真や自動運転などの低レベルの視覚アプリケーションでは、画像のデノイングが不可欠である。
既存の手法では、現実のシーンで複雑なノイズパターンを識別し、重要な計算資源を消費する。
本研究では、マルチビュー機能統合と効率的なシーケンスモデリングを組み合わせた、コンテキスト誘導型Receptance Weighted Key-Value(M)モデルを提案する。
このモデルは、複数の実世界の画像復号化データセットで検証され、既存の最先端の手法を定量的に上回り、推論時間を最大40%削減する。
論文 参考訳(メタデータ) (2025-05-05T14:57:43Z) - Structure-Accurate Medical Image Translation based on Dynamic Frequency Balance and Knowledge Guidance [60.33892654669606]
拡散モデルは,必要な医用画像を合成するための強力な戦略である。
既存のアプローチはまだ、高周波情報の過度な適合による解剖学的構造歪みの問題に悩まされている。
本稿では,動的周波数バランスと知識指導に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2025-04-13T05:48:13Z) - Fed-NDIF: A Noise-Embedded Federated Diffusion Model For Low-Count Whole-Body PET Denoising [16.937074760667745]
LCPET (low-count positron emission tomography) は、患者の放射線曝露を減少させるが、画像ノイズの増加と病変検出性の低下に悩まされることが多い。
拡散モデルでは、劣化した画像の品質を回復するLCPET復調が期待できる。
本稿では,これらの課題に対処するために,新しいノイズ埋め込み型フェデレート学習拡散モデル(Fed-NDIF)を提案する。
論文 参考訳(メタデータ) (2025-03-20T18:37:46Z) - Enhancing Low Dose Computed Tomography Images Using Consistency Training Techniques [7.694256285730863]
本稿では,雑音レベル調整の柔軟性を提供するベータノイズ分布について紹介する。
HN-iCT(High Noise Improved Consistency Training)は、教師付き方式で訓練される。
以上の結果より,HN-iCTを用いた非条件画像生成はNFE=1。
論文 参考訳(メタデータ) (2024-11-19T02:48:36Z) - Synomaly Noise and Multi-Stage Diffusion: A Novel Approach for Unsupervised Anomaly Detection in Ultrasound Imaging [32.99597899937902]
拡散モデルに基づく新しい教師なし異常検出フレームワークを提案する。
提案手法は, 合成ノイズ関数と多段拡散過程を組み込む。
提案手法は頸動脈US,脳MRI,肝CTを用いて検討した。
論文 参考訳(メタデータ) (2024-11-06T15:43:51Z) - Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.110544509099526]
ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。
ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。
主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文 参考訳(メタデータ) (2024-03-15T07:18:43Z) - Advancing Unsupervised Low-light Image Enhancement: Noise Estimation, Illumination Interpolation, and Self-Regulation [55.07472635587852]
低光画像強調(LLIE)技術は、画像の詳細の保存とコントラストの強化に顕著な進歩をもたらした。
これらのアプローチは、動的ノイズを効率的に緩和し、様々な低照度シナリオを収容する上で、永続的な課題に直面する。
まず,低照度画像の雑音レベルを迅速かつ高精度に推定する方法を提案する。
次に、照明と入力の一般的な制約を満たすために、Learningable Illumination Interpolator (LII) を考案する。
論文 参考訳(メタデータ) (2023-05-17T13:56:48Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Multi-stage image denoising with the wavelet transform [125.2251438120701]
深部畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、正確な構造情報を自動マイニングすることで、画像の復調に使用される。
動的畳み込みブロック(DCB)、2つのカスケードウェーブレット変換および拡張ブロック(WEB)、残留ブロック(RB)の3段階を経由した、MWDCNNによるCNNの多段階化を提案する。
論文 参考訳(メタデータ) (2022-09-26T03:28:23Z) - CTformer: Convolution-free Token2Token Dilated Vision Transformer for
Low-dose CT Denoising [11.67382017798666]
低線量CT(LDCT)はCT研究において重要な問題である。
視覚変換器は畳み込みニューラルネットワーク(CNN)よりも優れた特徴表現能力を示している
低用量CT用コンボリューションフリーToken2Token Dilated Vision Transformerを提案する。
論文 参考訳(メタデータ) (2022-02-28T02:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。