論文の概要: PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology
- arxiv url: http://arxiv.org/abs/2505.20202v1
- Date: Mon, 26 May 2025 16:42:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 19:27:26.950442
- Title: PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology
- Title(参考訳): PathBench: 精度オンコロジーに向けた病理基盤モデルの総合的比較ベンチマーク
- Authors: Jiabo Ma, Yingxue Xu, Fengtao Zhou, Yihui Wang, Cheng Jin, Zhengrui Guo, Jianfeng Wu, On Ki Tang, Huajun Zhou, Xi Wang, Luyang Luo, Zhengyu Zhang, Du Cai, Zizhao Gao, Wei Wang, Yueping Liu, Jiankun He, Jing Cui, Zhenhui Li, Jing Zhang, Feng Gao, Xiuming Zhang, Li Liang, Ronald Cheong Kin Chan, Zhe Wang, Hao Chen,
- Abstract要約: 病理基盤モデル(PFM)の最初の包括的なベンチマークであるPathBenchを紹介する。
我々のフレームワークは大規模データを組み込んで,PFMの客観的比較を可能にする。
当院では10病院で8,549人の患者から15,888件のWSIを収集し,64件以上の診断・予後調査を行った。
- 参考スコア(独自算出の注目度): 33.51485504161335
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The emergence of pathology foundation models has revolutionized computational histopathology, enabling highly accurate, generalized whole-slide image analysis for improved cancer diagnosis, and prognosis assessment. While these models show remarkable potential across cancer diagnostics and prognostics, their clinical translation faces critical challenges including variability in optimal model across cancer types, potential data leakage in evaluation, and lack of standardized benchmarks. Without rigorous, unbiased evaluation, even the most advanced PFMs risk remaining confined to research settings, delaying their life-saving applications. Existing benchmarking efforts remain limited by narrow cancer-type focus, potential pretraining data overlaps, or incomplete task coverage. We present PathBench, the first comprehensive benchmark addressing these gaps through: multi-center in-hourse datasets spanning common cancers with rigorous leakage prevention, evaluation across the full clinical spectrum from diagnosis to prognosis, and an automated leaderboard system for continuous model assessment. Our framework incorporates large-scale data, enabling objective comparison of PFMs while reflecting real-world clinical complexity. All evaluation data comes from private medical providers, with strict exclusion of any pretraining usage to avoid data leakage risks. We have collected 15,888 WSIs from 8,549 patients across 10 hospitals, encompassing over 64 diagnosis and prognosis tasks. Currently, our evaluation of 19 PFMs shows that Virchow2 and H-Optimus-1 are the most effective models overall. This work provides researchers with a robust platform for model development and offers clinicians actionable insights into PFM performance across diverse clinical scenarios, ultimately accelerating the translation of these transformative technologies into routine pathology practice.
- Abstract(参考訳): 病理基盤モデルの出現は計算病理学に革命をもたらし、癌診断の改善と予後評価のために高度に正確で一般化された全スライディング画像解析を可能にした。
これらのモデルは、がん診断や予後学において顕著な可能性を示しているが、その臨床翻訳は、がんタイプ全体にわたる最適なモデルにおける可変性、評価における潜在的なデータ漏洩、標準化されたベンチマークの欠如など、重要な課題に直面している。
厳格で偏りのない評価がなければ、最も先進的なPFMのリスクは研究環境に限られており、寿命の短縮が図られている。
既存のベンチマークの取り組みは、狭いがんタイプの焦点、潜在的な事前訓練データ重複、あるいは不完全なタスクカバレッジによって制限されている。
われわれはこれらのギャップに対処する最初の総合ベンチマークであるPathBenchについて紹介する。多施設のインタイムデータセットと厳密な漏洩防止、診断から予後までの全臨床スペクトルの評価、および継続的モデル評価のための自動リーダーボードシステムである。
我々のフレームワークは大規模データを組み込んで,実世界の臨床の複雑さを反映しながら,PFMの客観的比較を可能にする。
すべての評価データは、データ漏洩のリスクを避けるために、トレーニング済みの使用を厳格に除外して、民間の医療提供者から取得される。
当院では10病院で8,549人の患者から15,888件のWSIを収集し,64件以上の診断・予後調査を行った。
現在、19個のPFMを評価した結果、Virchow2とH-Optimus-1が最も有効なモデルであることが示されている。
この研究は、モデル開発のための堅牢なプラットフォームを提供し、様々な臨床シナリオにまたがってPFMのパフォーマンスに関する実践的な洞察を提供する。
関連論文リスト
- Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文 参考訳(メタデータ) (2025-01-30T06:49:57Z) - Prediction of Lung Metastasis from Hepatocellular Carcinoma using the SEER Database [0.9055332067000195]
肝細胞癌(HCC)は、がん関連死亡の原因である。
HCCにおける肺転移の予測モデルは、範囲と臨床応用性に限られている。
本研究では,Surveillance, Epidemiology, End Results (SEER)データベースのデータを用いて,エンドツーエンドの機械学習パイプラインの開発と検証を行う。
論文 参考訳(メタデータ) (2025-01-20T20:06:31Z) - Enhancing End Stage Renal Disease Outcome Prediction: A Multi-Sourced Data-Driven Approach [7.212939068975618]
10,326人のCKD患者のデータを利用して,2009年から2018年までの臨床とクレーム情報を組み合わせた。
24ヶ月の観測窓は早期検出と予測精度のバランスをとるのに最適であると同定された。
2021年のeGFR方程式は予測精度を改善し、特にアフリカ系アメリカ人の偏見を低減した。
論文 参考訳(メタデータ) (2024-10-02T03:21:01Z) - Enhancing clinical decision support with physiological waveforms -- a multimodal benchmark in emergency care [0.9503773054285559]
本稿では,救急医療におけるマルチモーダル意思決定支援を推進すべく,データセットとベンチマークプロトコルを提案する。
本モデルでは, 人口統計, バイオメトリックス, バイタルサイン, 検査値, 心電図(ECG)波形を入力として, 放電診断と患者の劣化の双方を予測する。
論文 参考訳(メタデータ) (2024-07-25T08:21:46Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。