論文の概要: CTIS-QA: Clinical Template-Informed Slide-level Question Answering for Pathology
- arxiv url: http://arxiv.org/abs/2601.01769v1
- Date: Mon, 05 Jan 2026 03:54:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.755803
- Title: CTIS-QA: Clinical Template-Informed Slide-level Question Answering for Pathology
- Title(参考訳): CTIS-QA : 臨床テンプレートインフォームドスライドレベル質問に対する病理検査
- Authors: Hao Lu, Ziniu Qian, Yifu Li, Yang Zhou, Bingzheng Wei, Yan Xu,
- Abstract要約: 臨床診断テンプレートに基づくパイプラインを導入し,病理情報を体系的に収集し,構成する。
CTIS-QAは、病理学者の診断アプローチを模倣した二重ストリームアーキテクチャを特徴とするスライドレベルの質問回答モデルである。
- 参考スコア(独自算出の注目度): 14.647193383163284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce a clinical diagnosis template-based pipeline to systematically collect and structure pathological information. In collaboration with pathologists and guided by the the College of American Pathologists (CAP) Cancer Protocols, we design a Clinical Pathology Report Template (CPRT) that ensures comprehensive and standardized extraction of diagnostic elements from pathology reports. We validate the effectiveness of our pipeline on TCGA-BRCA. First, we extract pathological features from reports using CPRT. These features are then used to build CTIS-Align, a dataset of 80k slide-description pairs from 804 WSIs for vision-language alignment training, and CTIS-Bench, a rigorously curated VQA benchmark comprising 977 WSIs and 14,879 question-answer pairs. CTIS-Bench emphasizes clinically grounded, closed-ended questions (e.g., tumor grade, receptor status) that reflect real diagnostic workflows, minimize non-visual reasoning, and require genuine slide understanding. We further propose CTIS-QA, a Slide-level Question Answering model, featuring a dual-stream architecture that mimics pathologists' diagnostic approach. One stream captures global slide-level context via clustering-based feature aggregation, while the other focuses on salient local regions through attention-guided patch perception module. Extensive experiments on WSI-VQA, CTIS-Bench, and slide-level diagnostic tasks show that CTIS-QA consistently outperforms existing state-of-the-art models across multiple metrics. Code and data are available at https://github.com/HLSvois/CTIS-QA.
- Abstract(参考訳): 本稿では,病理情報を体系的に収集・構造化するための臨床診断テンプレートに基づくパイプラインを提案する。
臨床病理学報告テンプレート(CPRT)を設計し,病理学報告から診断要素の包括的かつ標準化された抽出を確実にする。
TCGA-BRCAにおけるパイプラインの有効性を検証した。
まず,CPRTを用いた報告から病理的特徴を抽出する。
これらの機能は、視覚言語アライメントトレーニングのために804 WSIから80kのスライド記述ペアのデータセットであるCTIS-Alignと、977 WSIと14,879の質問応答ペアからなる厳密にキュレートされたVQAベンチマークであるCTIS-Benchを構築するために使用される。
CTIS-Benchは、実際の診断のワークフローを反映し、非視覚的推論を最小化し、真のスライド理解を必要とする、臨床的に根拠付きで閉ざされた質問(例えば、腫瘍のグレード、受容体の状態)を強調している。
さらに,病理医の診断アプローチを模倣した二重ストリームアーキテクチャを特徴とする,スライドレベルの質問応答モデルであるCTIS-QAを提案する。
1つのストリームはクラスタリングベースの特徴集約を通じてグローバルなスライドレベルのコンテキストをキャプチャし、もう1つは注意誘導型パッチ認識モジュールを通じて、正常なローカルリージョンに焦点を当てる。
WSI-VQA、CTIS-Bench、スライドレベルの診断タスクに関する大規模な実験は、CTIS-QAが既存の最先端モデルを複数のメトリクスで一貫して上回っていることを示している。
コードとデータはhttps://github.com/HLSvois/CTIS-QA.comで公開されている。
関連論文リスト
- A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - MedVQA-TREE: A Multimodal Reasoning and Retrieval Framework for Sarcopenia Prediction [1.7775777785480917]
MedVQA-TREEは階層的な画像解釈モジュール、ゲート機能レベルの融合機構、新しいマルチホップ・マルチクエリ検索戦略を統合したフレームワークである。
ゲート融合機構は、視覚的特徴をテキストクエリと選択的に統合し、臨床知識は、PubMedにアクセスするUMLS誘導パイプラインとサルコピア固有の外部知識ベースを介して検索する。
診断精度は99%まで向上し、従来の最先端の手法を10%以上上回った。
論文 参考訳(メタデータ) (2025-08-26T13:31:01Z) - ChatEXAONEPath: An Expert-level Multimodal Large Language Model for Histopathology Using Whole Slide Images [19.661619004001654]
本稿では,WSIを用いた病理組織学のエキスパートレベルのMLLMについて紹介する。
62.9%の受け入れ率でChatEXAONEPathを用いて病理像を診断できることを実証した。
提案モデルでは, 膵臓WSIsと臨床経過を種々のがんタイプから理解することができる。
論文 参考訳(メタデータ) (2025-04-17T15:33:17Z) - MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement [1.6355783973385114]
多視点認識知識強化型TansfoRmer(MvKeTR)
複数の解剖学的ビューから診断情報を効果的に合成するために、ビューアウェアのMVPAを提案する。
クエリボリュームに基づいて、最も類似したレポートを取得するために、Cross-Modal Knowledge Enhancer (CMKE) が考案されている。
論文 参考訳(メタデータ) (2024-11-27T12:58:23Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Clinical Temporal Relation Extraction with Probabilistic Soft Logic
Regularization and Global Inference [50.029659413650194]
既存のメソッドは、高価な機能エンジニアリングを必要とするか、イベント間のグローバルな依存関係をモデル化できない。
本稿では,確率論的ソフト論理規則化とグローバル推論を用いた新しい臨床時間緩和法を提案する。
論文 参考訳(メタデータ) (2020-12-16T08:23:03Z) - Hierarchical Reinforcement Learning for Automatic Disease Diagnosis [52.111516253474285]
政策学習のための対話システムに2段階の階層的な政策構造を統合することを提案する。
提案した政策構造は,多くの疾患や症状を含む診断問題に対処することができる。
論文 参考訳(メタデータ) (2020-04-29T15:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。