論文の概要: PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology
- arxiv url: http://arxiv.org/abs/2505.20202v1
- Date: Mon, 26 May 2025 16:42:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 19:27:26.950442
- Title: PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology
- Title(参考訳): PathBench: 精度オンコロジーに向けた病理基盤モデルの総合的比較ベンチマーク
- Authors: Jiabo Ma, Yingxue Xu, Fengtao Zhou, Yihui Wang, Cheng Jin, Zhengrui Guo, Jianfeng Wu, On Ki Tang, Huajun Zhou, Xi Wang, Luyang Luo, Zhengyu Zhang, Du Cai, Zizhao Gao, Wei Wang, Yueping Liu, Jiankun He, Jing Cui, Zhenhui Li, Jing Zhang, Feng Gao, Xiuming Zhang, Li Liang, Ronald Cheong Kin Chan, Zhe Wang, Hao Chen,
- Abstract要約: 病理基盤モデル(PFM)の最初の包括的なベンチマークであるPathBenchを紹介する。
我々のフレームワークは大規模データを組み込んで,PFMの客観的比較を可能にする。
当院では10病院で8,549人の患者から15,888件のWSIを収集し,64件以上の診断・予後調査を行った。
- 参考スコア(独自算出の注目度): 33.51485504161335
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The emergence of pathology foundation models has revolutionized computational histopathology, enabling highly accurate, generalized whole-slide image analysis for improved cancer diagnosis, and prognosis assessment. While these models show remarkable potential across cancer diagnostics and prognostics, their clinical translation faces critical challenges including variability in optimal model across cancer types, potential data leakage in evaluation, and lack of standardized benchmarks. Without rigorous, unbiased evaluation, even the most advanced PFMs risk remaining confined to research settings, delaying their life-saving applications. Existing benchmarking efforts remain limited by narrow cancer-type focus, potential pretraining data overlaps, or incomplete task coverage. We present PathBench, the first comprehensive benchmark addressing these gaps through: multi-center in-hourse datasets spanning common cancers with rigorous leakage prevention, evaluation across the full clinical spectrum from diagnosis to prognosis, and an automated leaderboard system for continuous model assessment. Our framework incorporates large-scale data, enabling objective comparison of PFMs while reflecting real-world clinical complexity. All evaluation data comes from private medical providers, with strict exclusion of any pretraining usage to avoid data leakage risks. We have collected 15,888 WSIs from 8,549 patients across 10 hospitals, encompassing over 64 diagnosis and prognosis tasks. Currently, our evaluation of 19 PFMs shows that Virchow2 and H-Optimus-1 are the most effective models overall. This work provides researchers with a robust platform for model development and offers clinicians actionable insights into PFM performance across diverse clinical scenarios, ultimately accelerating the translation of these transformative technologies into routine pathology practice.
- Abstract(参考訳): 病理基盤モデルの出現は計算病理学に革命をもたらし、癌診断の改善と予後評価のために高度に正確で一般化された全スライディング画像解析を可能にした。
これらのモデルは、がん診断や予後学において顕著な可能性を示しているが、その臨床翻訳は、がんタイプ全体にわたる最適なモデルにおける可変性、評価における潜在的なデータ漏洩、標準化されたベンチマークの欠如など、重要な課題に直面している。
厳格で偏りのない評価がなければ、最も先進的なPFMのリスクは研究環境に限られており、寿命の短縮が図られている。
既存のベンチマークの取り組みは、狭いがんタイプの焦点、潜在的な事前訓練データ重複、あるいは不完全なタスクカバレッジによって制限されている。
われわれはこれらのギャップに対処する最初の総合ベンチマークであるPathBenchについて紹介する。多施設のインタイムデータセットと厳密な漏洩防止、診断から予後までの全臨床スペクトルの評価、および継続的モデル評価のための自動リーダーボードシステムである。
我々のフレームワークは大規模データを組み込んで,実世界の臨床の複雑さを反映しながら,PFMの客観的比較を可能にする。
すべての評価データは、データ漏洩のリスクを避けるために、トレーニング済みの使用を厳格に除外して、民間の医療提供者から取得される。
当院では10病院で8,549人の患者から15,888件のWSIを収集し,64件以上の診断・予後調査を行った。
現在、19個のPFMを評価した結果、Virchow2とH-Optimus-1が最も有効なモデルであることが示されている。
この研究は、モデル開発のための堅牢なプラットフォームを提供し、様々な臨床シナリオにまたがってPFMのパフォーマンスに関する実践的な洞察を提供する。
関連論文リスト
- A High Magnifications Histopathology Image Dataset for Oral Squamous Cell Carcinoma Diagnosis and Prognosis [18.549808005574985]
Multi-OSCCは口腔扁平上皮癌1,325例からなる新しい病理組織像データセットである。
x200,x400,x1000倍率の6つの高分解能組織像を呈し,コアとエッジの腫瘍領域を2倍率で観察した。
このデータセットは、再発予測(REC)、リンパ節転移(LNM)、腫瘍分化(TD)、腫瘍浸潤(TI)、硬膜外浸潤(PI)の6つの重要な臨床的タスクに対して豊富に注釈付けされている。
論文 参考訳(メタデータ) (2025-07-22T08:48:45Z) - Benchmarking Foundation Models and Parameter-Efficient Fine-Tuning for Prognosis Prediction in Medical Imaging [26.589728923739596]
我々は、新型コロナウイルス患者の臨床結果を予測するために、畳み込みニューラルネットワークとファンデーションモデルの伝達可能性を評価し、比較した。
評価は、広範囲にわたるフルデータシナリオと、より現実的なFew-Shot Learning設定の両方を含む、複数の学習パラダイムで実施された。
論文 参考訳(メタデータ) (2025-06-23T09:16:04Z) - Zero-shot Medical Event Prediction Using a Generative Pre-trained Transformer on Electronic Health Records [8.575985305475355]
生成事前学習型トランス (GPT) は, EHRにおける時系列データを利用して, 将来の事象を予測できる。
これらのモデルの微調整はタスク固有のパフォーマンスを高めるが、多くの臨床予測タスクに適用するとコストがかかる。
事前訓練された基礎モデルはゼロショット予測設定で使用することができ、結果ごとに微調整された個別モデルに代わるスケーラブルな代替手段を提供する。
論文 参考訳(メタデータ) (2025-03-07T19:26:47Z) - Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文 参考訳(メタデータ) (2025-01-30T06:49:57Z) - Prediction of Lung Metastasis from Hepatocellular Carcinoma using the SEER Database [0.9055332067000195]
肝細胞癌(HCC)は、がん関連死亡の原因である。
HCCにおける肺転移の予測モデルは、範囲と臨床応用性に限られている。
本研究では,Surveillance, Epidemiology, End Results (SEER)データベースのデータを用いて,エンドツーエンドの機械学習パイプラインの開発と検証を行う。
論文 参考訳(メタデータ) (2025-01-20T20:06:31Z) - Enhancing End Stage Renal Disease Outcome Prediction: A Multi-Sourced Data-Driven Approach [7.212939068975618]
10,326人のCKD患者のデータを利用して,2009年から2018年までの臨床とクレーム情報を組み合わせた。
24ヶ月の観測窓は早期検出と予測精度のバランスをとるのに最適であると同定された。
2021年のeGFR方程式は予測精度を改善し、特にアフリカ系アメリカ人の偏見を低減した。
論文 参考訳(メタデータ) (2024-10-02T03:21:01Z) - Enhancing clinical decision support with physiological waveforms -- a multimodal benchmark in emergency care [0.9503773054285559]
本稿では,救急医療におけるマルチモーダル意思決定支援を推進すべく,データセットとベンチマークプロトコルを提案する。
本モデルでは, 人口統計, バイオメトリックス, バイタルサイン, 検査値, 心電図(ECG)波形を入力として, 放電診断と患者の劣化の双方を予測する。
論文 参考訳(メタデータ) (2024-07-25T08:21:46Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Foresight -- Deep Generative Modelling of Patient Timelines using
Electronic Health Records [46.024501445093755]
医学史の時間的モデリングは、将来の出来事を予測し、シミュレートしたり、リスクを見積り、代替診断を提案したり、合併症を予測するために使用することができる。
我々は、文書テキストを構造化されたコード化された概念に変換するためにNER+Lツール(MedCAT)を使用する新しいGPT3ベースのパイプラインであるForesightを提示する。
論文 参考訳(メタデータ) (2022-12-13T19:06:00Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。