論文の概要: CPathAgent: An Agent-based Foundation Model for Interpretable High-Resolution Pathology Image Analysis Mimicking Pathologists' Diagnostic Logic
- arxiv url: http://arxiv.org/abs/2505.20510v1
- Date: Mon, 26 May 2025 20:22:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.28489
- Title: CPathAgent: An Agent-based Foundation Model for Interpretable High-Resolution Pathology Image Analysis Mimicking Pathologists' Diagnostic Logic
- Title(参考訳): CPathAgent: 医師の診断論理を模倣した高分解能画像解析のためのエージェントベース基礎モデル
- Authors: Yuxuan Sun, Yixuan Si, Chenglu Zhu, Kai Zhang, Zhongyi Shui, Bowen Ding, Tao Lin, Lin Yang,
- Abstract要約: CPathAgentは、病理学者の推論プロセスを模倣し、ズームイン/アウトおよびナビゲーション操作を自律的に実行するエージェントベースのモデルである。
CPathAgentは3つのベンチマークで既存のアプローチを一貫して上回っている。
- 参考スコア(独自算出の注目度): 12.75486013022629
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in computational pathology have led to the emergence of numerous foundation models. However, these approaches fail to replicate the diagnostic process of pathologists, as they either simply rely on general-purpose encoders with multi-instance learning for classification or directly apply multimodal models to generate reports from images. A significant limitation is their inability to emulate the diagnostic logic employed by pathologists, who systematically examine slides at low magnification for overview before progressively zooming in on suspicious regions to formulate comprehensive diagnoses. To address this gap, we introduce CPathAgent, an innovative agent-based model that mimics pathologists' reasoning processes by autonomously executing zoom-in/out and navigation operations across pathology images based on observed visual features. To achieve this, we develop a multi-stage training strategy unifying patch-level, region-level, and whole-slide capabilities within a single model, which is essential for mimicking pathologists, who require understanding and reasoning capabilities across all three scales. This approach generates substantially more detailed and interpretable diagnostic reports compared to existing methods, particularly for huge region understanding. Additionally, we construct an expert-validated PathMMU-HR$^{2}$, the first benchmark for huge region analysis, a critical intermediate scale between patches and whole slides, as diagnosticians typically examine several key regions rather than entire slides at once. Extensive experiments demonstrate that CPathAgent consistently outperforms existing approaches across three scales of benchmarks, validating the effectiveness of our agent-based diagnostic approach and highlighting a promising direction for the future development of computational pathology.
- Abstract(参考訳): 近年の計算病理学の進歩は、多くの基礎モデルの出現に繋がった。
しかし、これらのアプローチは病理学者の診断過程の再現に失敗し、分類にマルチインスタンス学習を用いた汎用エンコーダに頼るか、画像からレポートを生成するために直接マルチモーダルモデルを適用する。
病理学者が採用する診断ロジックをエミュレートできないことは、不審な領域を徐々に拡大して包括的な診断を定式化する前に、概観的に低い倍率でスライドを体系的に調べることができないことである。
このギャップに対処するために、CPathAgentは、病理学者の推論プロセスを模倣した革新的なエージェントベースモデルであり、観察された視覚的特徴に基づいて、病理画像のズームイン/アウトとナビゲーション操作を自律的に実行する。
これを実現するために我々は,3つの尺度にまたがる理解と推論能力を必要とする病理学者を模倣するために不可欠な,パッチレベル,地域レベル,全スライディング能力を単一モデルに統一する多段階トレーニング戦略を開発した。
このアプローチは、特に巨大な地域理解のために、既存の手法と比較して、かなり詳細な、解釈可能な診断レポートを生成する。
さらに我々は,大規模領域解析のための最初のベンチマークであるPathMMU-HR$^{2}$を構築し,パッチとスライド間の重要な中間スケールを構築した。
CPathAgentは3種類のベンチマークで既存のアプローチを一貫して上回り、エージェントベースの診断手法の有効性を検証し、今後の計算病理学の発展に向けて有望な方向性を強調している。
関連論文リスト
- PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。
本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。
本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2025-04-09T14:58:21Z) - A Survey of Pathology Foundation Model: Progress and Future Directions [3.009351592961681]
コンピュータ病理学では、自動がん診断のためにスライド画像全体を解析する。
最近の病理基盤モデル (PFM) は, 大規模な病理組織学的データに基づいて, 抽出器と凝集器の双方を大幅に強化している。
PFMを組織する階層的な分類法を,任意の領域の基盤モデル解析に適用可能なトップダウンの哲学を通じて提案する。
論文 参考訳(メタデータ) (2025-04-05T03:44:09Z) - Efficient and Comprehensive Feature Extraction in Large Vision-Language Model for Pathology Analysis [37.11302829771659]
大規模視覚言語モデル(LVLM)は、入力解像度の制約によって制限され、病理画像解析の効率と精度を損なう。
課題誘導型機能拡張と課題誘導型詳細機能補完の2つの革新的戦略を提案する。
OmniPathは診断精度と効率において既存の方法よりも優れていた。
論文 参考訳(メタデータ) (2024-12-12T18:07:23Z) - Anatomy-guided Pathology Segmentation [56.883822515800205]
本研究では, 解剖学的特徴と病理学的情報を組み合わせた汎用的セグメンテーションモデルを構築し, 病理学的特徴のセグメンテーション精度を高めることを目的とする。
我々の解剖学・病理学交流(APEx)訓練では,ヒト解剖学の問合せ表現に結合特徴空間をデコードする問合せベースのセグメンテーション変換器を用いている。
これにより、FDG-PET-CTとChest X-Rayの病理分類タスクにおいて、強力なベースライン法に比べて最大3.3%のマージンで、ボード全体で最高の結果を報告できる。
論文 参考訳(メタデータ) (2024-07-08T11:44:15Z) - Validating polyp and instrument segmentation methods in colonoscopy through Medico 2020 and MedAI 2021 Challenges [58.32937972322058]
メディコオートマチックポリープセグメンテーション(Medico 2020)と「メディコ:医療画像の透明性(MedAI 2021)」コンペティション。
本報告では, それぞれのコントリビューションを包括的に分析し, ベストパフォーマンスメソッドの強さを強調し, クリニックへの臨床翻訳の可能性について考察する。
論文 参考訳(メタデータ) (2023-07-30T16:08:45Z) - PathAsst: A Generative Foundation AI Assistant Towards Artificial
General Intelligence of Pathology [15.419350834457136]
病理学における診断・予測分析に革命をもたらすための多モード生成基盤AIアシスタントであるPathAsstを提案する。
PathAsstの開発には、データ取得、CLIPモデル適応、PathAsstのマルチモーダル生成機能のトレーニングの3つの重要なステップが含まれている。
PathAsstの実験結果は、病理診断と治療プロセスを改善するためにAIを利用した生成基盤モデルを活用する可能性を示している。
論文 参考訳(メタデータ) (2023-05-24T11:55:50Z) - Shape-aware Meta-learning for Generalizing Prostate MRI Segmentation to
Unseen Domains [68.73614619875814]
前立腺MRIのセグメント化におけるモデル一般化を改善するために,新しい形状認識メタラーニング手法を提案する。
実験結果から,本手法は未確認領域の6つの設定すべてにおいて,最先端の一般化手法を一貫して上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2020-07-04T07:56:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。