論文の概要: Stress-testing cross-cancer generalizability of 3D nnU-Net for PET-CT tumor segmentation: multi-cohort evaluation with novel oesophageal and lung cancer datasets
- arxiv url: http://arxiv.org/abs/2508.18612v1
- Date: Tue, 26 Aug 2025 02:25:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.643988
- Title: Stress-testing cross-cancer generalizability of 3D nnU-Net for PET-CT tumor segmentation: multi-cohort evaluation with novel oesophageal and lung cancer datasets
- Title(参考訳): PET-CT腫瘍セグメンテーションのための3D nnU-Netのストレス試験クロスカンサーの一般化性:新しい食道および肺がんデータセットを用いたマルチコホート評価
- Authors: Soumen Ghosh, Christine Jestin Hannan, Rajat Vashistha, Parveen Kundu, Sandra Brosda, Lauren G. Aoude, James Lonie, Andrew Nathanson, Jessica Ng, Andrew P. Barbour, Viktor Vegh,
- Abstract要約: 本研究はPET-CTによるnU-Netのクロス癌評価である。
3つのパラダイムで3D nnUNetモデルをトレーニングし、テストしました。
テストセットでは、食道のみのモデルが最高ドメイン内精度(平均DSC, 57.8)を達成したが、インド外部の肺コホートでは失敗した。
公衆のみのモデルはより広範に一般化された(つまり、オートPETでは63.5、インド肺コホートでは51.6)が、食道オーストラリアコホートでは性能が低かった。
- 参考スコア(独自算出の注目度): 0.16999906736255554
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Robust generalization is essential for deploying deep learning based tumor segmentation in clinical PET-CT workflows, where anatomical sites, scanners, and patient populations vary widely. This study presents the first cross cancer evaluation of nnU-Net on PET-CT, introducing two novel, expert-annotated whole-body datasets. 279 patients with oesophageal cancer (Australian cohort) and 54 with lung cancer (Indian cohort). These cohorts complement the public AutoPET dataset and enable systematic stress-testing of cross domain performance. We trained and tested 3D nnUNet models under three paradigms. Target only (oesophageal), public only (AutoPET), and combined training. For the tested sets, the oesophageal only model achieved the best in-domain accuracy (mean DSC, 57.8) but failed on external Indian lung cohort (mean DSC less than 3.4), indicating severe overfitting. The public only model generalized more broadly (mean DSC, 63.5 on AutoPET, 51.6 on Indian lung cohort) but underperformed in oesophageal Australian cohort (mean DSC, 26.7). The combined approach provided the most balanced results (mean DSC, lung (52.9), oesophageal (40.7), AutoPET (60.9)), reducing boundary errors and improving robustness across all cohorts. These findings demonstrate that dataset diversity, particularly multi demographic, multi center and multi cancer integration, outweighs architectural novelty as the key driver of robust generalization. This work presents the demography based cross cancer deep learning segmentation evaluation and highlights dataset diversity, rather than model complexity, as the foundation for clinically robust segmentation.
- Abstract(参考訳): 臨床用PET-CTワークフローにおける深層学習に基づく腫瘍セグメンテーションの展開にはロバストな一般化が不可欠であり、解剖学的部位、スキャナー、患者集団は様々である。
本研究では,PET-CT上でのnnU-Netのクロス癌評価を初めて行った。
食道癌(Australian cohort)は279例,肺癌(Indian cohort)は54例であった。
これらのコホートは、パブリックなAutoPETデータセットを補完し、クロスドメインパフォーマンスの系統的なストレステストを可能にする。
3つのパラダイムで3D nnUNetモデルをトレーニングし、テストしました。
ターゲットのみ(食道)、パブリックのみ(AutoPET)、総合トレーニング。
テストセットでは、食道のみのモデルは、ドメイン内で最高の精度(平均DSC, 57.8)を達成したが、インド外部の肺コホート(平均DSCは3.4以下)では失敗し、過度なオーバーフィットを示した。
公衆のみのモデルはより広範に一般化された(AutoPETでは63.5、インド肺コホートでは51.6、食道オーストラリアコホートでは26.7)。
組み合わせたアプローチは、最もバランスのとれた結果(平均DSC、肺(52.9)、食道(40.7)、オートPET(60.9))を提供し、境界誤差を減らし、コホート全体の堅牢性を改善した。
これらの結果から, データセットの多様性, 特にマルチ人口動態, マルチセンター, マルチがん統合が, 頑健な一般化の鍵要因として, 建築上の新規性を上回ることが示唆された。
本研究は, 癌横断型ディープラーニングセグメンテーションの評価を行い, 臨床的に堅牢なセグメンテーションの基礎として, モデル複雑性よりもデータセットの多様性を強調した。
関連論文リスト
- Cancer-Net PCa-Seg: Benchmarking Deep Learning Models for Prostate Cancer Segmentation Using Synthetic Correlated Diffusion Imaging [65.83291923029985]
前立腺癌(PCa)は米国で最も多いがんであり、約30,000人、全診断の29%、2024年に35,000人が死亡した。
前立腺特異的抗原 (PSA) 検査やMRI (MRI) などの従来のスクリーニング法は診断において重要であるが、特異性や一般化性には限界がある。
U-Net, SegResNet, Swin UNETR, Attention U-Net, LightM-UNetといった最先端のディープラーニングモデルを用いて200ドルのCDIから前立腺を抽出する。
論文 参考訳(メタデータ) (2025-01-15T22:23:41Z) - From FDG to PSMA: A Hitchhiker's Guide to Multitracer, Multicenter Lesion Segmentation in PET/CT Imaging [0.9384264274298444]
本稿では,ResEncL アーキテクチャを用いた nnU-Net フレームワークを用いたマルチトラス,マルチセンタの一般化を目的とした AutoPET III チャレンジの解決策を提案する。
主なテクニックは、CT、MR、PETデータセット間での誤調整データ拡張とマルチモーダル事前トレーニングである。
Diceスコアが57.61となったデフォルトのnnU-Netと比較して、Diceスコアが68.40であり、偽陽性(FPvol: 7.82)と偽陰性(FNvol: 10.35)が減少している。
論文 参考訳(メタデータ) (2024-09-14T16:39:17Z) - Deep Learning-Based Segmentation of Tumors in PET/CT Volumes: Benchmark of Different Architectures and Training Strategies [0.12301374769426145]
本研究は,癌病変の自動分類のためのニューラルネットワークアーキテクチャとトレーニング戦略について検討する。
V-NetモデルとnnU-Netモデルは、それぞれのデータセットに対して最も効果的であった。
がんのない症例をAutoPETデータセットから除去することで,ほとんどのモデルの性能が向上した。
論文 参考訳(メタデータ) (2024-04-15T13:03:42Z) - Detection of subclinical atherosclerosis by image-based deep learning on chest x-ray [86.38767955626179]
460胸部X線で冠状動脈カルシウム(CAC)スコアを予測する深層学習アルゴリズムを開発した。
AICACモデルの診断精度は, 曲線下領域(AUC)で評価された。
論文 参考訳(メタデータ) (2024-03-27T16:56:14Z) - Quantifying uncertainty in lung cancer segmentation with foundation models applied to mixed-domain datasets [6.712251433139412]
医用画像基盤モデルは、極小調整で臓器や腫瘍を分割する能力を示している。
これらのモデルは通常、タスク固有の分散(ID)データセットで評価される。
我々は、自己教師付き学習(SSL)で訓練された複数の基礎モデルの性能を評価するために、計算的に高速なメトリクスの包括的セットを導入する。
SMITは最も高いF1スコア(LRAD: 0.60, 5Rater: 0.64)と低いエントロピー(LRAD: 0.06, 5Rater: 0.12)を生成し、高い腫瘍検出率と確実なセグメンテーションを示した。
論文 参考訳(メタデータ) (2024-03-19T19:36:48Z) - Joint nnU-Net and Radiomics Approaches for Segmentation and Prognosis of
Head and Neck Cancers with PET/CT images [6.361835964390572]
3D nnU-Netアーキテクチャは原発性腫瘍とリンパ節の自動分節に同期的に採用された。
従来の放射能の特徴のみを含む3つの予後モデルが構築された。
セグメンテーションと予後タスクの評価指標としてDice scoreとC-indexが用いられた。
論文 参考訳(メタデータ) (2022-11-18T10:31:26Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - CT-based COVID-19 Triage: Deep Multitask Learning Improves Joint
Identification and Severity Quantification [45.86448200141968]
感染リスクのある患者をできるだけ早期に分離する研究を優先するための新型コロナウイルスの同定、重度定量化、重篤な患者の研究の強調、病院への誘導、救急医療の提供の2つの基本的な設定について述べる。
両トリアージアプローチを統合するマルチタスクアプローチを提案し、利用可能なラベルを1つのモデルにまとめる畳み込みニューラルネットワークを提案する。
我々は約2000件の公開CT研究をトレーニングし、32件のCOVID-19研究、30件の細菌性肺炎、31件の健常患者、および30件の肺病理患者からなる慎重に設計したセットを用いて、典型的な患者の血流をエミュレートする。
論文 参考訳(メタデータ) (2020-06-02T08:05:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。