論文の概要: Masked and Predictive Self-Supervised Foundation Models for 3D Brain MRI
- arxiv url: http://arxiv.org/abs/2606.13315v1
- Date: Thu, 11 Jun 2026 13:09:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.808652
- Title: Masked and Predictive Self-Supervised Foundation Models for 3D Brain MRI
- Title(参考訳): 3次元脳MRIのためのマズード・予測型自己監督基礎モデル
- Authors: Esra Ergün, Hersh Chandarana, Dan Sodickson, Gözde Ünal,
- Abstract要約: MRIによる疾患検出のための2つの自己教師型事前訓練パラダイムについて検討した。
我々は,新しいスペクトル領域再構成損失をMAEに導入することで,補助目標の役割について検討する。
本研究は,医療基盤モデル事前トレーニングにおける自己指導型客観的デザインの重要性を浮き彫りにしたものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised foundation models have shown strong promise in medical imaging. However, existing MRI foundation-model studies have primarily emphasized segmentation and dense prediction tasks, while systematic investigation of self-supervised foundation models for MRI-based disease detection remains limited. In this work, we investigate two major self-supervised pretraining paradigms for MRI-based disease detection: reconstruction-based learning via Masked Autoencoders (MAE) and predictive representation learning via Joint Embedding Predictive Architectures (JEPA). We study the role of auxiliary objectives by introducing a novel spectral-domain reconstruction loss for MAE to enhance sensitivity to fine-grained anatomical structure, and by integrating variance--covariance regularization (VCR) within our JEPA framework to encourage decorrelated latent representations. Our models are pretrained on heterogeneous single-contrast MRI volumes in a contrast-agnostic setting, without modality concatenation. Across five downstream disease detection tasks, our results highlight the importance of self-supervised objective design for medical foundation model pretraining, demonstrating that the downstream benefit of each objective is determined by its relevance to the task's structure. Specifically, spectral regularization yields the largest improvements when the downstream discriminative signal is characterized by strong high-frequency anatomical structures, while covariance regularization is most beneficial when discriminative information spans multiple decorrelated feature dimensions. MAE with spectral-domain supervision consistently achieves superior downstream performance for MRI-based disease detection. These findings suggest that self-supervised objectives in medical imaging encode specific biases, and their downstream benefit is fundamentally conditioned on the task's structure.
- Abstract(参考訳): 自己監督型基礎モデルは医用画像に強く期待されている。
しかし、既存のMRI基礎モデル研究は、主にセグメンテーションと密集予測タスクを強調しているが、MRIに基づく疾患検出のための自己監督基盤モデルの体系的な研究は限られている。
本研究では,MRIを用いた疾患検出のための自己教師型事前訓練パラダイムとして,Masked Autoencoders (MAE) による再構成学習と,JEPA (Joint Embedding Predictive Architectures) による予測表現学習の2つについて検討する。
我々は,MAEに新しいスペクトル領域再構成損失を導入し,微細な解剖構造への感受性を高めるとともに,JEPAフレームワークに分散-共分散正則化(VCR)を統合することで,非相関な潜在表現を促進することで,補助目的の役割について検討した。
コントラストに依存しない条件下で, 異質な単一コントラストMRIボリュームに対して, モダリティを伴わない事前訓練を行った。
本研究は,5つの下流疾患検出課題にまたがって,医療基礎モデル事前訓練における自己指導型客観的デザインの重要性を強調し,各目標の下流利益が課題の構造との関連性によって決定されることを示した。
特に、スペクトル正則化は、下流の識別信号が強い高周波解剖学的構造によって特徴づけられる場合に最大の改善をもたらすが、識別情報が複数の非相関特徴次元にまたがる場合、共分散正則化は最も有益である。
スペクトル領域を監督するMAEは、MRIによる疾患検出において、常に優れたダウンストリーム性能を達成する。
これらの結果から,医療画像における自己監督的目的が特定のバイアスを符号化し,その下流の利点がタスクの構造に根ざしていることが示唆された。
関連論文リスト
- Delving Aleatoric Uncertainty in Medical Image Segmentation via Vision Foundation Models [56.29123284262618]
本研究は,視覚基盤モデルの普遍的表現能力を生かして固有データ不確実性を推定することを提案する。
モデルのデコード表現の特徴の多様性を分析し,その特異値エネルギーを定量化し,各クラスに対する意味知覚尺度を定義する。
この基礎に基づいて,本研究は,(1)潜在的にノイズの多いサンプルを排除し,モデル学習品質を向上させるためのアレータリック不確実性認識データフィルタリング機構,(2)意味認識尺度に基づくトレーニング中にクラス固有の損失重みを適応的に調整する動的不確実性認識最適化戦略,およびトレーニング安定性を向上させるラベル認知機構の2つの不確実性駆動型アプリケーション戦略を設計する。
論文 参考訳(メタデータ) (2026-04-13T03:59:54Z) - Removing Motion Artifact in MRI by Using a Perceptual Loss Driven Deep Learning Framework [6.697790479726774]
PERCEPT-Netは深層学習フレームワークである。
フレームワークの中核は第3回モーション・パーセプティカル・ロス(MPL)であり、これはアーティファクトを意識したパーセプティカル・コントロール戦略である。
PerCEPT-Netは臨床データで最先端の手法に優れていた。
論文 参考訳(メタデータ) (2026-04-12T03:30:39Z) - Aligning Findings with Diagnosis: A Self-Consistent Reinforcement Learning Framework for Trustworthy Radiology Reporting [37.57009831483529]
MLLM(Multimodal Large Language Models)は放射線学レポート生成に強い可能性を示している。
本フレームワークは, より詳細な発見のための思考ブロックと, 構造化された疾患ラベルに対する回答ブロックという, 生成を2つの異なる構成要素に再構成する。
論文 参考訳(メタデータ) (2026-01-06T14:17:44Z) - Region-Aware Reconstruction Strategy for Pre-training fMRI Foundation Model [0.7771985426812056]
我々は,自己指導型事前訓練中に,意味的コヒーレントな脳領域を選択的にマスキングするためのROI誘導マスキング戦略を導入する。
本手法はADHDと診断された個人から健康的なコントロールを識別するための分類精度が4.23%向上したことを示す。
以上の結果から, モデル前訓練における解剖学的領域のマスキングは, 解釈可能性を高めるだけでなく, より堅牢で差別的な表現をもたらすことが示唆された。
論文 参考訳(メタデータ) (2025-11-01T08:12:00Z) - MedAlign: A Synergistic Framework of Multimodal Preference Optimization and Federated Meta-Cognitive Reasoning [52.064286116035134]
我々はMed-VQA(Med-VQA)のための視覚的LVLM応答を保証するフレームワークであるMedAlignを開発した。
まず、優先学習を視覚的コンテキストに合わせるために、マルチモーダルな直接選好最適化(mDPO)の目的を提案する。
次に、画像とテキストの類似性を生かし、クエリを専門的でコンテキスト拡張されたLVLMにルーティングする検索型混合処理(RA-MoE)アーキテクチャを設計する。
論文 参考訳(メタデータ) (2025-10-24T02:11:05Z) - Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Decipher-MR: A Vision-Language Foundation Model for 3D MRI Representations [12.805804608410739]
Decipher-MRは、大規模なデータセットに基づいて訓練された3次元MRI固有の視覚言語基盤モデルである。
Decipher-MRは、自己指導型視覚学習とレポート誘導型テキスト監視を統合し、堅牢で一般化可能な表現を構築する。
以上の結果から,Decipher-MRはMRIベースのAIのスケーラブルで汎用的な基盤として確立され,臨床および研究領域における効率的な開発が促進される。
論文 参考訳(メタデータ) (2025-09-25T14:43:33Z) - LoRKD: Low-Rank Knowledge Decomposition for Medical Foundation Models [59.961172635689664]
知識分解」は、特定の医療課題のパフォーマンス向上を目的としている。
我々はLow-Rank Knowledge Decomposition(LoRKD)という新しいフレームワークを提案する。
LoRKDは、低ランクのエキスパートモジュールと効率的な知識分離畳み込みを組み込むことで、グラデーションを異なるタスクから明確に分離する。
論文 参考訳(メタデータ) (2024-09-29T03:56:21Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。