論文の概要: Pan-FM: A Pan-Organ Foundation Model with Saliency-Guided Masking for Missing Robustness
- arxiv url: http://arxiv.org/abs/2605.07055v1
- Date: Fri, 08 May 2026 00:04:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.685292
- Title: Pan-FM: A Pan-Organ Foundation Model with Saliency-Guided Masking for Missing Robustness
- Title(参考訳): Pan-FM:ロバストさを損なうためのサリエンシ誘導マスク付きパンオーガンファンデーションモデル
- Authors: Qiangqiang Wu, Grace McIlvain, Zhou Yu, Junhao Wen,
- Abstract要約: そこで本研究では,7臓器からのイメージングを前提としたパン・オーガナイゼーション・モデルPan-FMを提案する。
Pan-FMはトレーニングと推論の両方で臓器の欠損を処理する統一されたバックボーンを使用し、マスクベースの自己蒸留で事前訓練されている。
Pan-FMは、システム神経科学におけるマルチモーダル学習における現実的なモダリティの欠如に対するスケーラブルな解決策として機能する。
- 参考スコア(独自算出の注目度): 26.024188999307516
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation models (FMs) have shown great promise in medical imaging, but most FMs are trained on unimodal data within isolated domains, such as brain MRI alone. Human aging and disease arise through coordinated biological processes across organs, therefore motivating multimodal FMs that learn whole-body representations. A key challenge, however, is that real-world multimodal biomedical data are often missing not at random, which can reduce power, limit generalizability, and introduce bias. We propose Pan-FM, a pan-organ foundation model pre-trained on imaging from seven organs (Brain, Heart, Adipose, Liver, Kidney, Spleen, and Pancreas) under realistic missing-organ scenarios. Pan-FM uses a unified backbone that handles organ missingness during both training and inference, and is pre-trained with masking-based self-distillation. We find that naive multimodal pre-training leads to dominant-organ shortcut learning bias, with the model over-relying on dominant organs such as adipose and heart. To address this, we introduce Saliency-Guided Masking (SGM), which uses the model attention distribution to adaptively mask dominant organs during pre-training, thus encouraging more balanced cross-organ, whole-body learning. Notably, SGM introduces negligible computational overhead and can be seamlessly integrated into existing self-supervised learning frameworks to improve multi-organ representation learning. On the UK Biobank, Pan-FM achieves stronger prediction across 13 disease categories and 14 single disease entities than single-organ and multi-organ baselines, with improved robustness under missing-organ settings. Pan-FM serves as a scalable solution to realistic modality-missingness in multimodal learning in system neuroscience and as a step toward more generalizable whole-body FMs.
- Abstract(参考訳): ファンデーションモデル(FM)は、医療画像において非常に有望であるが、ほとんどのFMは、脳MRIのような孤立した領域内の一過性のデータに基づいて訓練されている。
ヒトの老化と病気は、臓器をまたいだ協調された生物学的プロセスを通じて起こるため、全身の表現を学習するマルチモーダルFMを動機付けている。
しかし、重要な課題は、実世界のマルチモーダルなバイオメディカルデータがしばしばランダムに欠落していることだ。
そこで本研究では,7臓器(脳,心臓,脂肪,肝臓,腎臓,脾臓,膵臓)のイメージングを前提としたパン・オーガナイゼーションモデルPan-FMを提案する。
Pan-FMはトレーニングと推論の両方で臓器の欠損を処理する統一されたバックボーンを使用し、マスクベースの自己蒸留で事前訓練されている。
主観的マルチモーダル事前学習は,主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・主観的・
そこで本研究では,Saliency-Guided Masking (SGM) を導入し,事前学習中に支配的な臓器を適応的にマスキングし,よりバランスの取れたクロスオーガニックな全身学習を促す。
特に、SGMは無視可能な計算オーバーヘッドを導入し、既存の自己組織化学習フレームワークにシームレスに統合して、マルチ組織表現学習を改善することができる。
英国バイオバンクでは、13の疾患カテゴリと14の単一の疾患エンティティに対して、単一組織や複数組織のベースラインよりも強い予測を達成し、欠落した組織設定下での堅牢性の向上を実現している。
Pan-FMは、システム神経科学におけるマルチモーダル学習における現実的なモダリティの欠如に対するスケーラブルな解決策であり、より一般化可能な全身FMへのステップである。
関連論文リスト
- M-IDoL: Information Decomposition for Modality-Specific and Diverse Representation Learning in Medical Foundation Model [53.96788246923603]
マルチモーダル表現学習のための情報分解を導入したM-IDoLを提案する。
1.15万の医療画像の事前トレーニングにより、M-IDoL i)は21の下流臨床タスクに優れた一般化を提供する。
論文 参考訳(メタデータ) (2026-04-10T04:06:11Z) - Toward a Multi-View Brain Network Foundation Model: Cross-View Consistency Learning Across Arbitrary Atlases [62.33465338932216]
MV-BrainFMは任意のアトラスで構築された脳ネットワークから一般化可能でスケーラブルな表現を学ぶために設計された多視点脳ネットワーク基盤モデルである。
17のfMRIデータセットから20万名以上の被験者を対象に行った実験では、MV-BrainFMは既存の14の脳ネットワーク基盤モデルより一貫して優れていた。
論文 参考訳(メタデータ) (2026-03-20T11:55:00Z) - From Tissue Plane to Organ World: A Benchmark Dataset for Multimodal Biomedical Image Registration using Deep Co-Attention Networks [17.718448707146017]
組織と臓器の登録は、特定の組織学的セクションがヒトの臓器のごく一部しか取得できないため、追加の課題となる。
私たちは、さまざまな機関からソースを得たATOMベンチマークデータセットを作成し、この課題を機械学習問題に変換することを目的としています。
RegisMCANモデルの性能は,臓器画像から抽出した部分領域が全体の3次元体積内からどこから抽出されたのかを正確に予測する深層学習の可能性を示している。
論文 参考訳(メタデータ) (2024-06-06T14:21:15Z) - NeuroPictor: Refining fMRI-to-Image Reconstruction via Multi-individual Pretraining and Multi-level Modulation [55.51412454263856]
本稿では,fMRI信号を用いた拡散モデル生成過程を直接変調することを提案する。
様々な個人から約67,000 fMRI-imageペアのトレーニングを行うことで,fMRI-to-imageデコーディング能力に優れたモデルが得られた。
論文 参考訳(メタデータ) (2024-03-27T02:42:52Z) - BioBridge: Bridging Biomedical Foundation Models via Knowledge Graphs [27.32543389443672]
独立に訓練された単調FMをブリッジしてマルチモーダル動作を確立するための,パラメータ効率のよい新しい学習フレームワークであるBioBridgeを提案する。
実験結果から,BioBridgeは最高基準のKG埋め込み法に勝ることを示した。
また、BioBridgeは、未知のモダリティや関係を外挿することで、ドメイン外一般化能力を示す。
論文 参考訳(メタデータ) (2023-10-05T05:30:42Z) - Customizing General-Purpose Foundation Models for Medical Report
Generation [64.31265734687182]
ラベル付き医用画像-レポートペアの不足は、ディープニューラルネットワークや大規模ニューラルネットワークの開発において大きな課題となっている。
本稿では,コンピュータビジョンと自然言語処理の基盤モデル (FM) として,市販の汎用大規模事前学習モデルのカスタマイズを提案する。
論文 参考訳(メタデータ) (2023-06-09T03:02:36Z) - Multimodal foundation models are better simulators of the human brain [65.10501322822881]
1500万の画像テキストペアを事前訓練した,新たに設計されたマルチモーダル基礎モデルを提案する。
視覚的エンコーダも言語的エンコーダもマルチモーダルで訓練され,脳に近いことが判明した。
論文 参考訳(メタデータ) (2022-08-17T12:36:26Z) - Generalized Organ Segmentation by Imitating One-shot Reasoning using
Anatomical Correlation [55.1248480381153]
そこで我々は,アノテーション付きオルガンクラスから一般化されたオルガン概念を学習し,その概念を未知のクラスに転送するOrganNetを提案する。
そこで,OrganNetは臓器形態の幅広い変化に効果的に抵抗でき,一発分節タスクで最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-30T13:41:12Z) - Multi-organ Segmentation via Co-training Weight-averaged Models from
Few-organ Datasets [45.14004510709325]
そこで本研究では,少数のデータセットから統一的なマルチ組織セグメンテーションネットワークを学習するための平均重み付きモデルを提案する。
ネットワーク間のノイズの多い指導を緩和するため、より信頼性の高いソフトラベルを作成するために、平均的な重み付けモデルを採用する。
論文 参考訳(メタデータ) (2020-08-17T08:39:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。