論文の概要: Leveraging Image Editing Foundation Models for Data-Efficient CT Metal Artifact Reduction
- arxiv url: http://arxiv.org/abs/2604.05934v1
- Date: Tue, 07 Apr 2026 14:32:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.882774
- Title: Leveraging Image Editing Foundation Models for Data-Efficient CT Metal Artifact Reduction
- Title(参考訳): データ効率の良いCT金属アーチファクト削減のための画像編集基礎モデルの活用
- Authors: Ahmet Rasim Emirdagi, Süleyman Aslan, Mısra Yavuz, Görkay Aydemir, Yunus Bilge Kurt, Nasrin Rahimi, Burak Can Biner, M. Akın Yılmaz,
- Abstract要約: 高減衰インプラントによる金属人工物は、CT画像の品質を著しく低下させる。
本稿では,文脈内推論タスクとしてアーティファクトリダクションのフレーミングというパラダイムシフトを提案する。
提案手法は16対128対のトレーニング例のみで有効なアーティファクト抑制を実現する。
- 参考スコア(独自算出の注目度): 2.201656998025222
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Metal artifacts from high-attenuation implants severely degrade CT image quality, obscuring critical anatomical structures and posing a challenge for standard deep learning methods that require extensive paired training data. We propose a paradigm shift: reframing artifact reduction as an in-context reasoning task by adapting a general-purpose vision-language diffusion foundation model via parameter-efficient Low-Rank Adaptation (LoRA). By leveraging rich visual priors, our approach achieves effective artifact suppression with only 16 to 128 paired training examples reducing data requirements by two orders of magnitude. Crucially, we demonstrate that domain adaptation is essential for hallucination mitigation; without it, foundation models interpret streak artifacts as erroneous natural objects (e.g., waffles or petri dishes). To ground the restoration, we propose a multi-reference conditioning strategy where clean anatomical exemplars from unrelated subjects are provided alongside the corrupted input, enabling the model to exploit category-specific context to infer uncorrupted anatomy. Extensive evaluation on the AAPM CT-MAR benchmark demonstrates that our method achieves state-of-the-art performance on perceptual and radiological-feature metrics . This work establishes that foundation models, when appropriately adapted, offer a scalable alternative for interpretable, data-efficient medical image reconstruction. Code is available at https://github.com/ahmetemirdagi/CT-EditMAR.
- Abstract(参考訳): 高減衰インプラントによる金属人工物は、CT画像の品質を著しく低下させ、重要な解剖学的構造を隠蔽し、広範囲なペアトレーニングデータを必要とする標準的な深層学習法に挑戦する。
本稿では,パラメータ効率の低いローランド適応(LoRA)を用いて,汎用視覚言語拡散基盤モデルを適用することで,文脈内推論タスクとしてのアーティファクトの削減を実現するパラダイムシフトを提案する。
よりリッチな視覚的事前情報を活用することにより,データ要求を2桁に減らした16~128対のトレーニング例で,効果的な人工物抑制を実現する。
基礎モデルでは, ストリークアーティファクトを誤った自然物(例えばワッフルやペトリ料理)として解釈する。
そこで本研究では,無関係な被験者からのクリーンな解剖例を破損した入力と共に提供するマルチ参照条件付け手法を提案する。
AAPM CT-MAR ベンチマークによる広範囲な評価により,本手法は知覚的および放射線学的特徴量に対して最先端の性能を達成できることが示されている。
この研究は、ファンデーションモデルが適切に適合すると、解釈可能でデータ効率の良い医療画像再構成のためのスケーラブルな代替手段を提供することを証明している。
コードはhttps://github.com/ahmetemirdagi/CT-EditMARで入手できる。
関連論文リスト
- Structure-constrained Language-informed Diffusion Model for Unpaired Low-dose Computed Tomography Angiography Reconstruction [72.80209358480424]
ヨウ素化コントラスト培地(ICM)の過剰摂取は、腎臓の損傷と致命的なアレルギー反応を引き起こす。
深層学習法は、低線量ICMから正常線量ICMのCT画像を生成することができ、必要な線量を減らすことができる。
本研究では,構造シナジーと空間知性を統合した構造制約型言語情報拡散モデル(SLDM)を提案する。
論文 参考訳(メタデータ) (2026-01-28T06:54:06Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Tunable-Generalization Diffusion Powered by Self-Supervised Contextual Sub-Data for Low-Dose CT Reconstruction [5.107409624991683]
Tunable-geneRalizatioN Diffusion (TurnDiff) は低用量CT再構成のための自己教師付き文脈データを用いている。
TurnDiffは、再構築と一般化の両方において、最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-09-28T13:50:29Z) - Direct Dual-Energy CT Material Decomposition using Model-based Denoising Diffusion Model [105.95160543743984]
本稿では,Dual-Energy Decomposition Model-based Diffusion (DEcomp-MoD) と呼ばれる深層学習手法を提案する。
Decomp-MoDは、教師なしスコアベースモデルと教師なしディープラーニングネットワークより優れていることを示す。
論文 参考訳(メタデータ) (2025-07-24T01:00:06Z) - Tomographic Foundation Model -- FORCE: Flow-Oriented Reconstruction Conditioning Engine [9.228750443979733]
深層学習はCT画像再構成を著しく進歩させた。
ディープラーニングの手法は、ほぼペアのデータでうまく機能するが、それらは本質的に幻覚のリスクを負う。
我々は新しいCTフレームワークFORCE(Flow-Oriented Restruction Conditioning Engine)を提案する。
論文 参考訳(メタデータ) (2025-06-02T18:25:12Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Unsupervised CT Metal Artifact Reduction by Plugging Diffusion Priors in
Dual Domains [8.40564813751161]
金属インプラントはしばしばCT画像の破壊的なアーティファクトを引き起こし、正確な診断を妨げる。
金属加工品(MAR)を減らすための教師付き深層学習に基づくいくつかのアプローチが提案されている。
本稿では,データ分布を表す高容量な生成モデルである拡散モデルに基づく教師なしMAR手法を提案する。
論文 参考訳(メタデータ) (2023-08-31T14:00:47Z) - Orientation-Shared Convolution Representation for CT Metal Artifact
Learning [63.67718355820655]
X線CT(CT)スキャン中、患者を乗せた金属インプラントは、しばしば有害なアーティファクトに繋がる。
既存のディープラーニングベースの手法は、有望な再構築性能を得た。
本稿では,人工物の物理的事前構造に適応するために,配向型畳み込み表現戦略を提案する。
論文 参考訳(メタデータ) (2022-12-26T13:56:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。