論文の概要: A Clinically Validated Foundation Model for Comprehensive Lung Pathology Interpretation
- arxiv url: http://arxiv.org/abs/2605.25878v1
- Date: Mon, 25 May 2026 14:04:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:20.246737
- Title: A Clinically Validated Foundation Model for Comprehensive Lung Pathology Interpretation
- Title(参考訳): 総合的肺疾患解釈のための臨床検証基礎モデル
- Authors: Zhengrui Guo, Zhengyu Zhang, Jiabo Ma, Yihui Wang, Fengtao Zhou, Yingxue Xu, Ling Liang, Chenglong Zhao, Qi Xie, Jinbang Li, Shujing Guo, Fangyi Han, Zhijian Cen, Ziyi Liu, Cheng Jin, Junlin Hou, Zhixuan Chen, Yu Cai, Lijuan Qu, Shifu Chen, Yueping Liu, Zhe Wang, Xiuming Zhang, Muyan Cai, Li Liang, Hao Chen,
- Abstract要約: PulmoFoundation(プルモファウンデーション)は、肺病理の総合的評価のための、RCT(RCT)評価基礎モデルである。
本モデルでは, 生検, 凍結部, 外科的切除スライスを対象とし, コア診断タスクにおける臨床成績を評価する。
- 参考スコア(独自算出の注目度): 36.95302007351382
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pathological assessment guides lung cancer diagnosis, treatment selection, and prognostic evaluation, yet current CPath approaches rely on task-specific models for isolated objectives. Although pan-cancer foundation models offer versatility, they lack subspecialty-level depth and have not been evaluated across clinical workflows or prospectively validated in real-world settings. We introduce PulmoFoundation, a multi-center, prospectively validated, randomized controlled trial (RCT)-evaluated foundation model for comprehensive lung pathology assessment across pre-operative, intra-operative, and post-operative care. Built upon Virchow2 via subspecialty-specific pretraining using ~40,000 diagnostic H&E-stained whole-slide images (WSIs), PulmoFoundation was systematically evaluated on ~26,000 WSIs across 32 clinically relevant tasks. In addition to accurately predicting molecular markers and patient survival, our model achieves clinical-grade performance in core diagnostic tasks across biopsy, frozen section, and surgical resection slides. In a registered prospective study of 1,357 patients across 11 diagnostic tasks, our model achieved an average AUC of 92.3%. Using pre-specified triage thresholds, PulmoFoundation could reduce additional second-review burden for 68.8% of biopsies and 83.0% of frozen sections, and defer 44.5% of IHC stain orders, with PPVs of 1.0, 0.991, and 0.966. Beyond prospective validation, we conducted a crossover RCT with eight pathologists, in which AI assistance improved diagnostic accuracy across 4,928 case-reader pairs (91.7% w/ AI vs. 83.8% w/o AI). AI assistance also reduced median diagnostic time by 19.6%, increased diagnostic confidence by 8.7%, and improved inter-rater agreement from moderate (kappa = 0.56) to substantial (kappa = 0.76). Together, these evaluations support PulmoFoundation as a clinically validated decision-support system for lung pathology.
- Abstract(参考訳): 病理学的評価は、肺癌の診断、治療選択、予後評価を導くが、現在のCPathアプローチは、独立した目的のためにタスク固有のモデルに依存している。
パン・カンサー基礎モデルは汎用性を提供するが、サブ特殊レベルの深さは欠如しており、臨床ワークフロー全体にわたって評価されていない。
術前,術中,術後の包括的肺病理評価のための多施設間ランダム化コントロールトライアル(RCT)評価基礎モデルであるPulmoFoundationを導入する。
約40,000の診断用H&E-stained whole-slide image (WSIs) を用いて、Virchow2を用いて、32の臨床的関連タスクにわたる約26,000 WSIに対して、PulmoFoundationを体系的に評価した。
本モデルでは, 分子マーカーと生存率の精度の予測に加えて, 生検, 凍結部, 外科的切除スライスを対象とし, コア診断における臨床成績も評価した。
11の診断課題にわたる1,357人の患者を対象とした登録調査では,平均AUCは92.3%であった。
プルーモファウンデーションは、予め指定されたトリアージ閾値を用いて、68.8%の生検と83.0%の凍結区間の2度目の見直しの負担を減らし、PPVが1.0、0.991、0.966のICC染色オーダーの44.5%を減らした。
8人の病理医とクロスオーバーRTTを行い、4,928対のケースリーダーペア(91.7%がAI対83.8%がAI対AI)の診断精度を改善した。
AIアシストはまた、中央値診断時間を19.6%削減し、診断信頼性を8.7%向上し、中間値(Kappa = 0.56)から実質値(Kappa = 0.76)に改善した。
これらの評価は,肺病理診断支援システムとしてのPulmoFoundationを支持した。
関連論文リスト
- A Breast Vision Pathology Foundation Model for Real-world Clinical Utility [65.57568187389113]
a bfBRAVE, a breast-adaptive pathology foundation model developed and evaluation using a total resources of 101,638 breast wholeslide images。
臨床ワークフローにおけるBRAVEの実践的役割は、通常のAI支援による第2レビューから低リスクのケースを安全に排除すること、そしてさらなる評価のためのケースの優先順位付けなどである。
論文 参考訳(メタデータ) (2026-05-06T07:44:39Z) - Clinician input steers frontier AI models toward both accurate and harmful decisions [10.599240857217811]
8つのフロンティアモデルにまたがる21の言語モデル (LLM) を, 差分診断生成と次のステップ勧告に基づいて評価した。
専門的な文脈は、21モデル全体にわたる正しい最終診断の包含を著しく改善した。
GPT-4o 実験では, 臨床症状の明確な不確実性信号により, 対側的文脈での診断性能が向上した。
論文 参考訳(メタデータ) (2026-03-14T23:47:53Z) - A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer [54.58205672910646]
RenalCLIPは、腎腫瘤の特徴、診断、予後のための視覚言語基盤モデルである。
腎がんの完全な臨床ワークフローにまたがる10のコアタスクにおいて、優れたパフォーマンスと優れた一般化性を実現した。
論文 参考訳(メタデータ) (2025-08-22T17:48:19Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z) - Explainable Anatomy-Guided AI for Prostate MRI: Foundation Models and In Silico Clinical Trials for Virtual Biopsy-based Risk Assessment [3.5408411348831232]
MRIによる前立腺癌(PCa)のリスク階層化のための,完全に自動化された,解剖学的に指導されたディープラーニングパイプラインを提案する。
パイプラインは、前立腺とそのゾーンを軸方向のT2強調MRI上にセグメント化するためのnnU-Netモジュール、オプションの解剖学的先行と臨床データで3Dパッチに微調整されたDiceedPT Swin Transformer基盤モデルに基づく分類モジュール、決定駆動画像領域をローカライズする反ファクトなヒートマップを生成するVAE-GANフレームワークの3つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2025-05-23T14:40:09Z) - A Clinician-Friendly Platform for Ophthalmic Image Analysis Without Technical Barriers [51.45596445363302]
GlobeReadyはクリニックフレンドリーなAIプラットフォームで、再トレーニング、微調整、技術専門知識の必要性なしに、基礎疾患の診断を可能にする。
光コヒーレンス・トモグラフィー(OCT)スキャンを用いて、カラー・ファンドス写真(CPF)を用いた11のファンドス病(93.9-98.5%)と15のファンドス病(87.2-92.7%)の精度を示した。
トレーニングなしのローカル機能拡張を活用することで、GlobeReadyプラットフォームは、センターや人口間のドメインシフトを効果的に軽減する。
論文 参考訳(メタデータ) (2025-04-22T14:17:22Z) - Development and prospective validation of a prostate cancer detection, grading, and workflow optimization system at an academic medical center [1.9729379339863824]
がん検出, グレーディング, IHC 注文症例のスクリーニングモデルを開発した。
タスク固有前立腺モデルの性能を汎用基礎モデルと比較した。
癌検出におけるタスク特異的モデルと基礎モデルの間に統計的に有意な差は認められなかった。
論文 参考訳(メタデータ) (2024-10-31T05:29:18Z) - Multi-institutional Validation of Two-Streamed Deep Learning Method for
Automated Delineation of Esophageal Gross Tumor Volume using planning-CT and
FDG-PETCT [14.312659667401302]
食道悪性腫瘍容積(GTV)コントゥーリングの現況は,高作業コストとユーザ間の変動を手作業で記述することに依存している。
1施設で開発された深層学習(DL)多モード食道GTVコンチューリングモデルの臨床的応用性を検証する。
論文 参考訳(メタデータ) (2021-10-11T13:56:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。