論文の概要: Prompt Guiding Multi-Scale Adaptive Sparse Representation-driven Network for Low-Dose CT MAR
- arxiv url: http://arxiv.org/abs/2504.19687v1
- Date: Mon, 28 Apr 2025 11:23:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.411104
- Title: Prompt Guiding Multi-Scale Adaptive Sparse Representation-driven Network for Low-Dose CT MAR
- Title(参考訳): 低線量CT MARのためのマルチスケール適応スパース表現駆動ネットワークのプロンプト誘導
- Authors: Baoshun Shi, Bing Chen, Shaolei Zhang, Huazhu Fu, Zhanli Hu,
- Abstract要約: 低線量CT(LDCT)はX線被曝を減らすことができるが、画質を低下させる可能性がある。
既存のディープラーニングベースの取り組みには,2つの大きな制限がある。
LDMARタスクのためのマルチスケール適応スパース表現駆動ネットワークPMSRNetを提案する。
- 参考スコア(独自算出の注目度): 48.23538056110433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Low-dose CT (LDCT) is capable of reducing X-ray radiation exposure, but it will potentially degrade image quality, even yields metal artifacts at the case of metallic implants. For simultaneous LDCT reconstruction and metal artifact reduction (LDMAR), existing deep learning-based efforts face two main limitations: i) the network design neglects multi-scale and within-scale information; ii) training a distinct model for each dose necessitates significant storage space for multiple doses. To fill these gaps, we propose a prompt guiding multi-scale adaptive sparse representation-driven network, abbreviated as PMSRNet, for LDMAR task. Specifically, we construct PMSRNet inspired from multi-scale sparsifying frames, and it can simultaneously employ within-scale characteristics and cross-scale complementarity owing to an elaborated prompt guiding scale-adaptive threshold generator (PSATG) and a built multi-scale coefficient fusion module (MSFuM). The PSATG can adaptively capture multiple contextual information to generate more faithful thresholds, achieved by fusing features from local, regional, and global levels. Furthermore, we elaborate a model interpretable dual domain LDMAR framework called PDuMSRNet, and train single model with a prompt guiding strategy for multiple dose levels. We build a prompt guiding module, whose input contains dose level, metal mask and input instance, to provide various guiding information, allowing a single model to accommodate various CT dose settings. Extensive experiments at various dose levels demonstrate that the proposed methods outperform the state-of-the-art LDMAR methods.
- Abstract(参考訳): 低線量CT(LDCT)はX線被曝を低減できるが、画像の品質を低下させる可能性があり、金属インプラントの場合の金属人工物も産出する。
LDCTの同時再建と金属アーチファクト削減(LDMAR)のために、既存のディープラーニングベースの取り組みは2つの主な制限に直面している。
一 ネットワーク設計は、マルチスケール及びイントラスケール情報を無視する。
二 各用量ごとに異なるモデルを訓練することで、複数の用量に対してかなりの貯蔵スペースを必要とすること。
これらのギャップを埋めるため,LDMARタスクのためのマルチスケール適応スパース表現駆動ネットワークPMSRNetを提案する。
具体的には,マルチスケールスカラー化フレームからインスパイアされたPMSRNetを構築し,PSATGとマルチスケール係数融合モジュール(MSFuM)により,内部特性とクロススケール補完性を同時に利用することができる。
PSATGは、複数のコンテキスト情報を適応的にキャプチャして、より忠実なしきい値を生成することができる。
さらに、PDuMSRNetと呼ばれるモデル解釈可能な二重ドメイン LDMAR フレームワークと、複数の線量レベルを即時誘導する単一モデルを訓練する。
入力に線量レベル、金属マスク、入力インスタンスを含むプロンプトガイドモジュールを構築し、様々なガイド情報を提供し、単一のモデルが様々なCT線量設定に対応できるようにする。
種々の線量レベルでの大規模な実験により、提案手法は最先端のLDMAR法よりも優れていることが示された。
関連論文リスト
- Large Language Models for Multimodal Deformable Image Registration [50.91473745610945]
そこで本研究では,様々な医用画像からの深い特徴の整合を図るために,新しい粗いMDIRフレームワークLLM-Morphを提案する。
具体的には、まずCNNエンコーダを用いて、クロスモーダル画像ペアから深い視覚的特徴を抽出し、次に、最初のアダプタを使ってこれらのトークンを調整する。
第3に、トークンのアライメントのために、他の4つのアダプタを使用して、LLM符号化トークンをマルチスケールの視覚特徴に変換し、マルチスケールの変形場を生成し、粗いMDIRタスクを容易にする。
論文 参考訳(メタデータ) (2024-08-20T09:58:30Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - MMFormer: Multimodal Transformer Using Multiscale Self-Attention for
Remote Sensing Image Classification [16.031616431297213]
ハイパースペクトル画像(HSI)と光検出・ランドング(LiDAR)などのデータソースを用いた、リモートセンシング(RS)画像分類のための新しいマルチモーダルトランス (MMFormer) を提案する。
畳み込みの帰納バイアスを欠く従来のビジョントランスフォーマー(ViT)と比較して、まず、HSIとLiDARのマルチモーダルデータからパッチをトークン化するために、MMFormerに畳み込み層を導入します。
提案したMSMHSAモジュールは、HSIをLiDARデータに粗い方法で組み込むことで、きめ細かい表現を学べる。
論文 参考訳(メタデータ) (2023-03-23T08:34:24Z) - Multi-scale Transformer Network with Edge-aware Pre-training for
Cross-Modality MR Image Synthesis [52.41439725865149]
クロスモダリティ磁気共鳴(MR)画像合成は、与えられたモダリティから欠落するモダリティを生成するために用いられる。
既存の(教師付き学習)手法は、効果的な合成モデルを訓練するために、多くのペア化されたマルチモーダルデータを必要とすることが多い。
マルチスケールトランスフォーマーネットワーク(MT-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T11:40:40Z) - (M)SLAe-Net: Multi-Scale Multi-Level Attention embedded Network for
Retinal Vessel Segmentation [0.0]
マルチステージ処理の課題に対処するため,マルチスケールでマルチレベルなCNNアーキテクチャ((M)SLAe-Net)を提案する。
我々は、複数のスケールとネットワークの複数のレベルの特徴を抽出することで、我々のモデルが局所的およびグローバル的特徴を全体的に抽出することを可能にする。
D-DPPモジュールは細管に効率よくタスク特異的な損失機能を持たせることで,クロスデータ性能の向上を実現した。
論文 参考訳(メタデータ) (2021-09-05T14:29:00Z) - DML-GANR: Deep Metric Learning With Generative Adversarial Network
Regularization for High Spatial Resolution Remote Sensing Image Retrieval [9.423185775609426]
我々は,HSR-RSI検索のためのDML-GANR(Generative Adversarial Network regularization)を用いたディープメトリック学習手法を開発した。
3つのデータセットの実験結果から,HSR-RSI検索における最先端技術よりもDML-GANRの方が優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-07T02:26:03Z) - Accurate and Lightweight Image Super-Resolution with Model-Guided Deep
Unfolding Network [63.69237156340457]
我々は、モデル誘導深部展開ネットワーク(MoG-DUN)と呼ばれるSISRに対する説明可能なアプローチを提示し、提唱する。
MoG-DUNは正確(エイリアスを少なくする)、計算効率(モデルパラメータを減らした)、多用途(多重劣化を処理できる)である。
RCAN, SRDNF, SRFBNを含む既存の最先端画像手法に対するMoG-DUN手法の優位性は、いくつかの一般的なデータセットと様々な劣化シナリオに関する広範な実験によって実証されている。
論文 参考訳(メタデータ) (2020-09-14T08:23:37Z) - More Diverse Means Better: Multimodal Deep Learning Meets Remote Sensing
Imagery Classification [43.35966675372692]
ディープネットワークをトレーニングし、ネットワークアーキテクチャを構築する方法を示します。
特に、深層ネットワークをトレーニングし、ネットワークアーキテクチャを構築する方法と同様に、異なる融合戦略を示す。
我々のフレームワークは画素単位の分類タスクに限らず、畳み込みニューラルネットワーク(CNN)を用いた空間情報モデリングにも適用できる。
論文 参考訳(メタデータ) (2020-08-12T17:45:25Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。