論文の概要: An Open Multi-Center Whole-Body FDG PET/CT Foundation Model for Tumor Segmentation
- arxiv url: http://arxiv.org/abs/2605.21835v1
- Date: Wed, 20 May 2026 23:59:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.035118
- Title: An Open Multi-Center Whole-Body FDG PET/CT Foundation Model for Tumor Segmentation
- Title(参考訳): 腫瘍分離のためのFDG PET/CTファンデーションモデル
- Authors: Xiaofeng Liu, Qianru Zhang, Thibault Marin, Menghua Xia, Chi Liu, Georges El Fakhri, Jinsong Ouyang,
- Abstract要約: 4つの公開データセットから4,997個のハーモナイズドスキャンを用いて,オープンソース,マルチセンター,全体FDG PET/CTファンデーションモデルを提案する。
我々のフレームワークは、初期のチャネルワイド結合を伴う階層的なUNet型のバックボーンを用いており、解剖学的および代謝学的特徴の相互作用を可能にしている。
オートマチック・オンコロジー・イメージングの進歩のための、堅牢でオープンソースの基盤を提供する。
- 参考スコア(独自算出の注目度): 9.922425508121012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The synergistic interpretation of anatomical information from computed tomography (CT) and metabolic information from positron emission tomography (PET) is important to oncologic imaging. However, existing deep learning methods for PET/CT remain largely task-specific, are often trained on single-center cohorts, or adopt dual-branch fusion schemes that delay cross-modal interaction and underutilize early spatial correspondence between PET and CT. To address these limitations, we present an open-source, multi-center, whole-body FDG PET/CT foundation model utilizing 4,997 harmonized scans from four public datasets. Our framework employs hierarchical UNet-shaped backbones with early channel-wise concatenation, enabling anatomical and metabolic features to interact from the first embedding layer onward. We further introduce a masked autoencoding objective based on zero-mean imputation, combined with a weighted global reconstruction loss. This design avoids non-physical intensity discontinuities at masked-region boundaries that arise from learnable mask tokens. On downstream AutoPET lesion segmentation, the proposed models demonstrate strong label efficiency: with only 10\% of the labeled training data, they achieve performance comparable to models trained from scratch on the full dataset. Under extreme 5-shot linear probing, joint PET/CT pretraining also achieves higher Dice scores than separated-modality pretraining. This multi-center foundation model demonstrates label efficiency and cross-modality representation learning for PET/CT tumor segmentation. It provides a robust, open-source basis for advancing automated oncologic imaging, significantly reducing the need for large-scale manual annotations in clinical practice.
- Abstract(参考訳): CTによる解剖学的情報とポジトロン断層撮影(PET)による代謝情報の相乗的解釈は腫瘍画像において重要である。
しかし、PET/CTの既存の深層学習法は、主にタスク固有であり、多くの場合、単一中心コホートで訓練される。
これらの制約に対処するため,4つの公開データセットから4,997個のハーモニゼーションスキャンを用いて,オープンソース,マルチセンター,全体FDG PET/CTファンデーションモデルを提案する。
我々のフレームワークは、初期のチャネルワイド結合を伴う階層的なUNet型のバックボーンを用いており、最初の埋め込み層から解剖学的および代謝的特徴の相互作用を可能にする。
さらに、ゼロ平均計算に基づくマスク付き自動符号化目標と、重み付けされた大域的再構成損失を導入する。
この設計は、学習可能なマスクトークンから生じるマスク領域境界における非物理的強度の不連続性を回避する。
ラベル付きトレーニングデータのわずか10%で、フルデータセットのスクラッチからトレーニングされたモデルに匹敵するパフォーマンスを達成する。
極端に5ショットの線形プローブの下では、関節PET/CTプレトレーニングは、分離モダリティプレトレーニングよりも高いDiceスコアが得られる。
この多中心基盤モデルはPET/CT腫瘍セグメンテーションにおけるラベル効率と相互モダリティ表現学習を実証する。
これは、自動腫瘍画像の進歩のための堅牢でオープンソースの基盤を提供し、臨床実践における大規模な手動アノテーションの必要性を著しく低減する。
関連論文リスト
- The autoPET3 Challenge: Automated Lesion Segmentation in Whole-Body PET/CT $\unicode{x2013}$ Multitracer Multicenter Generalization [67.92281859568168]
第3回オートPETチャレンジ(MICCAI 2024)の設計と成果を報告する。
全身PET/CTにおける自動病変分割を, 構成的一般化条件下でベンチマークした。
トップランクのアルゴリズムは平均DSCが0.66、FNVが3.18mL、FPVが2.78mLである。
論文 参考訳(メタデータ) (2026-05-07T07:07:09Z) - A Generalist Foundation Model for Total-body PET/CT Enables Diagnostic Reporting and System-wide Metabolic Profiling [17.709593152803695]
SDF-HOLOは全身PET/CTのマルチモーダル基礎モデルであり,1万人以上の患者を対象に事前トレーニングを行った。
二重ストリームエンコーダでCTとPETの表現学習を分離し、相互モードの相互作用モジュールを介してそれらを結合する。
このモデルは、システム全体の代謝プロファイルを可能にし、組織間の代謝ネットワーク相互作用の腫瘍関連指紋を明らかにする。
論文 参考訳(メタデータ) (2026-01-19T08:30:09Z) - Unveiling and Bridging the Functional Perception Gap in MLLMs: Atomic Visual Alignment and Hierarchical Evaluation via PET-Bench [48.60251555171943]
MLLM(Multimodal Large Language Models)は、異常検出や解剖学的モダリティのレポート生成などのタスクにおいて、顕著な熟練性を示した。
本研究では, 機能的トレーサの生体分布を, 形態的先行性とは無関係に復号化できない現状の視覚エンコーダについて, 基本的な機能的知覚ギャップを定量化する。
PET-Benchは52,308個の階層型QAペアからなるPET-Benchの最初の大規模機能評価ベンチマークである。
AVAは認知ギャップを効果的に橋渡しし、CoTを幻覚源から頑健な推論ツールに変換し、診断を改善していることを示す。
論文 参考訳(メタデータ) (2026-01-06T05:58:50Z) - impuTMAE: Multi-modal Transformer with Masked Pre-training for Missing Modalities Imputation in Cancer Survival Prediction [75.43342771863837]
我々は,効率的なマルチモーダル事前学習戦略を備えた新しいトランスフォーマーに基づくエンドツーエンドアプローチである impuTMAE を紹介する。
マスクされたパッチを再構築することで、モダリティの欠如を同時に示唆しながら、モダリティ間の相互作用とモダリティ内相互作用を学習する。
本モデルは,TGA-GBM/LGGとBraTSデータセットを用いたグリオーマ生存予測のために,異種不完全データに基づいて事前訓練を行った。
論文 参考訳(メタデータ) (2025-08-08T10:01:16Z) - Developing a PET/CT Foundation Model for Cross-Modal Anatomical and Functional Imaging [39.59895695500171]
FratMAE(Cross-Fraternal Twin Masked Autoencoder)は,全身解剖学的および機能的情報を効果的に統合する新しいフレームワークである。
FratMAEは複雑なクロスモーダル関係とグローバルな取り込みパターンをキャプチャし、下流タスクにおいて優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-03-04T17:49:07Z) - From FDG to PSMA: A Hitchhiker's Guide to Multitracer, Multicenter Lesion Segmentation in PET/CT Imaging [0.9384264274298444]
本稿では,ResEncL アーキテクチャを用いた nnU-Net フレームワークを用いたマルチトラス,マルチセンタの一般化を目的とした AutoPET III チャレンジの解決策を提案する。
主なテクニックは、CT、MR、PETデータセット間での誤調整データ拡張とマルチモーダル事前トレーニングである。
Diceスコアが57.61となったデフォルトのnnU-Netと比較して、Diceスコアが68.40であり、偽陽性(FPvol: 7.82)と偽陰性(FNvol: 10.35)が減少している。
論文 参考訳(メタデータ) (2024-09-14T16:39:17Z) - Contrastive Diffusion Model with Auxiliary Guidance for Coarse-to-Fine
PET Reconstruction [62.29541106695824]
本稿では, 粗い予測モジュール (CPM) と反復的修正モジュール (IRM) から構成される粗大なPET再構成フレームワークを提案する。
計算オーバーヘッドの大部分をCPMに委譲することで,本手法のサンプリング速度を大幅に向上させることができる。
2つの追加戦略、すなわち補助的な誘導戦略と対照的な拡散戦略が提案され、再構築プロセスに統合される。
論文 参考訳(メタデータ) (2023-08-20T04:10:36Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Multimodal Spatial Attention Module for Targeting Multimodal PET-CT Lung
Tumor Segmentation [11.622615048002567]
マルチモーダル空間アテンションモジュール(MSAM)は腫瘍に関連する領域を強調することを学ぶ。
MSAMは一般的なバックボーンアーキテクチャやトレーニングされたエンドツーエンドに適用できる。
論文 参考訳(メタデータ) (2020-07-29T10:27:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。