論文の概要: Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis
- arxiv url: http://arxiv.org/abs/2602.18400v1
- Date: Fri, 20 Feb 2026 18:05:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.406525
- Title: Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis
- Title(参考訳): 拡散変圧器を用いた統一3次元MRI合成のための完全知覚の爆発的完全性
- Authors: Junkai Liu, Nay Aung, Theodoros N. Arvanitis, Joao A. C. Lima, Steffen E. Petersen, Daniel C. Alexander, Le Zhang,
- Abstract要約: 本稿では,3次元MRIの統一合成のための完全性知覚を備えた潜時拡散モデルCoPeDiTを提案する。
CoPeDiTは最先端の手法よりも優れ、優れた堅牢性、一般化可能性、柔軟性を実現している。
- 参考スコア(独自算出の注目度): 9.857855424798732
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Missing data problems, such as missing modalities in multi-modal brain MRI and missing slices in cardiac MRI, pose significant challenges in clinical practice. Existing methods rely on external guidance to supply detailed missing state for instructing generative models to synthesize missing MRIs. However, manual indicators are not always available or reliable in real-world scenarios due to the unpredictable nature of clinical environments. Moreover, these explicit masks are not informative enough to provide guidance for improving semantic consistency. In this work, we argue that generative models should infer and recognize missing states in a self-perceptive manner, enabling them to better capture subtle anatomical and pathological variations. Towards this goal, we propose CoPeDiT, a general-purpose latent diffusion model equipped with completeness perception for unified synthesis of 3D MRIs. Specifically, we incorporate dedicated pretext tasks into our tokenizer, CoPeVAE, empowering it to learn completeness-aware discriminative prompts, and design MDiT3D, a specialized diffusion transformer architecture for 3D MRI synthesis, that effectively uses the learned prompts as guidance to enhance semantic consistency in 3D space. Comprehensive evaluations on three large-scale MRI datasets demonstrate that CoPeDiT significantly outperforms state-of-the-art methods, achieving superior robustness, generalizability, and flexibility. The code is available at https://github.com/JK-Liu7/CoPeDiT .
- Abstract(参考訳): マルチモーダル脳MRIにおけるモダリティの欠如や心臓MRIにおけるスライス欠如などの欠失データ問題は、臨床実践において重大な課題となっている。
既存の方法は、欠失したMRIを合成するように生成モデルに指示するために、詳細な欠失状態を供給するために外部ガイダンスに依存している。
しかし、臨床環境の予測不能な性質のため、実世界のシナリオでは手動指標が常に利用可能あるいは信頼性があるとは限らない。
さらに、これらの明示的なマスクは意味的一貫性を改善するためのガイダンスを提供するのに十分な情報ではない。
この研究において、生成モデルでは、欠落した状態を自己認識的に推測し、認識し、微妙な解剖学的および病理学的変異をよりよく捉えるべきであると論じる。
この目的に向けて,3次元MRIの統一合成のための完全性知覚を備えた汎用潜在拡散モデルであるCoPeDiTを提案する。
具体的には、3次元MRI合成のための特殊拡散トランスフォーマーアーキテクチャであるMDiT3Dを設計し、3次元空間における意味的一貫性を高めるためのガイダンスとして、学習したプロンプトを効果的に活用する。
3つの大規模MRIデータセットに対する総合的な評価は、CoPeDiTが最先端の手法を著しく上回り、優れた堅牢性、一般化可能性、柔軟性を実現していることを示している。
コードはhttps://github.com/JK-Liu7/CoPeDiTで入手できる。
関連論文リスト
- Multimodal Visual Surrogate Compression for Alzheimer's Disease Classification [69.87877580725768]
MVSC(Multimodal Visual Surrogate Compression)は、大規模な3D sMRIボリュームをコンパクトな2D機能に圧縮し、適応させることを学ぶ。
MVSCには2つの重要なコンポーネントがある: テキストガイダンスの下でグローバルなクロススライスコンテキストをキャプチャするボリュームコンテキストと、テキストエンハンスでパッチワイズな方法でスライスレベルの情報を集約するAdaptive Slice Fusionモジュール。
論文 参考訳(メタデータ) (2026-01-29T13:05:46Z) - Moving Beyond Diffusion: Hierarchy-to-Hierarchy Autoregression for fMRI-to-Image Reconstruction [65.67001243986981]
我々は,スケールワイド自己回帰モデルに基づく粗大なfMRI画像再構成フレームワークであるMindHierを提案する。
MindHierは、拡散ベースのベースラインよりも優れたセマンティック忠実さ、4.67倍高速な推論、より決定論的結果を達成する。
論文 参考訳(メタデータ) (2025-10-25T15:40:07Z) - ZECO: ZeroFusion Guided 3D MRI Conditional Generation [11.645873358288648]
ZECOはZeroFusionでガイドされた3D MRI条件生成フレームワークである。
対応する3Dセグメンテーションマスクを備えた高忠実度MRI画像の抽出、圧縮、生成を行う。
ZECOは、脳MRIデータセットの定量的および質的な評価において、最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2025-03-24T00:04:52Z) - Unified 3D MRI Representations via Sequence-Invariant Contrastive Learning [0.15749416770494706]
自己教師型深層学習は2次元の自然画像解析を加速させたが、3次元MRIへの変換は困難である。
定量的MRI(qMRI)を利用したemph-sequence-invariant self-supervised frameworkを提案する。
健常脳セグメンテーション(IXI)、脳梗塞セグメンテーション(ARC)、MRIによるデノイング実験は、ベースラインSSLアプローチよりも有意な増加を示した。
論文 参考訳(メタデータ) (2025-01-21T11:27:54Z) - ContextMRI: Enhancing Compressed Sensing MRI through Metadata Conditioning [51.26601171361753]
本稿では, 微細なメタデータを再構成プロセスに統合したMRI用テキスト条件拡散モデルであるContextMRIを提案する。
メタデータの忠実度はスライス位置やコントラストから患者年齢、性別、病理まで増加し、体系的に再構築性能が向上することを示す。
論文 参考訳(メタデータ) (2025-01-08T05:15:43Z) - MRGen: Segmentation Data Engine for Underrepresented MRI Modalities [59.61465292965639]
稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。
本稿では,データ合成における生成モデルの利用について検討する。
本稿では,テキストプロンプトとセグメンテーションマスクを条件とした医用画像合成のためのデータエンジンMRGenを提案する。
論文 参考訳(メタデータ) (2024-12-04T16:34:22Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Multiscale Metamorphic VAE for 3D Brain MRI Synthesis [5.060516201839319]
3次元脳MRIの創発的モデリングは、データ分布の十分なカバレッジを確保しつつ、高い視覚的忠実度を達成することの難しさを示す。
本研究では, この課題に対して, 可変オートエンコーダフレームワークにおける構成可能なマルチスケール形態素変換を用いて対処することを提案する。
VAEやGAN(Generative Adversarial Network)をベースとした先行作業と比較して,FIDの性能は,同等あるいは優れた再現品質を維持しつつ,大幅に向上した。
論文 参考訳(メタデータ) (2023-01-09T09:15:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。