論文の概要: PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration
- arxiv url: http://arxiv.org/abs/2603.08935v2
- Date: Wed, 11 Mar 2026 16:00:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 14:12:44.254977
- Title: PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration
- Title(参考訳): PathoScribe: セマンティック検索と臨床統合のための統一LLM駆動フレームワークを用いたリビングライブラリーへの変換
- Authors: Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan Niazi,
- Abstract要約: PathoScribeは静的な病理資料を検索可能なライビングライブラリに変換するために設計されたフレームワークである。
PathoScribeは、自然言語のケース検索に完璧なRecall@10を達成し、高品質な検索地上推論を実証した。
この研究は、パッシブストレージシステムからデジタル病理資料をアクティブな臨床知能プラットフォームに変換するためのスケーラブルな基盤を確立する。
- 参考スコア(独自算出の注目度): 2.867720204474286
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Pathology underpins modern diagnosis and cancer care, yet its most valuable asset, the accumulated experience encoded in millions of narrative reports, remains largely inaccessible. Although institutions are rapidly digitizing pathology workflows, storing data without effective mechanisms for retrieval and reasoning risks transforming archives into a passive data repository, where institutional knowledge exists but cannot meaningfully inform patient care. True progress requires not only digitization, but the ability for pathologists to interrogate prior similar cases in real time while evaluating a new diagnostic dilemma. We present PathoScribe, a unified retrieval-augmented large language model (LLM) framework designed to transform static pathology archives into a searchable, reasoning-enabled living library. PathoScribe enables natural language case exploration, automated cohort construction, clinical question answering, immunohistochemistry (IHC) panel recommendation, and prompt-controlled report transformation within a single architecture. Evaluated on 70,000 multi-institutional surgical pathology reports, PathoScribe achieved perfect Recall@10 for natural language case retrieval and demonstrated high-quality retrieval-grounded reasoning (mean reviewer score 4.56/5). Critically, the system operationalized automated cohort construction from free-text eligibility criteria, assembling research-ready cohorts in minutes (mean 9.2 minutes) with 91.3% agreement to human reviewers and no eligible cases incorrectly excluded, representing orders-of-magnitude reductions in time and cost compared to traditional manual chart review. This work establishes a scalable foundation for converting digital pathology archives from passive storage systems into active clinical intelligence platforms.
- Abstract(参考訳): 病理学は近代的な診断と癌治療の基盤となっているが、最も価値ある資産であり、数百万の物語のレポートにエンコードされた蓄積された経験は、ほとんどアクセス不能である。
組織は、病理のワークフローを急速にデジタル化しているが、効果的な検索機構のないデータ保存は、アーカイブをパッシブなデータリポジトリに変える。
真の進歩は、デジタル化だけでなく、病理学者が新しい診断ジレンマを評価しながら、過去の類似した事例をリアルタイムで尋問する能力も必要である。
PathoScribeは,静的な病理学アーカイブを検索可能な推論可能なリビングライブラリに変換するために設計された,統一的な検索拡張大型言語モデル(LLM)フレームワークである。
PathoScribeは、自然言語のケース探索、自動コーホート構築、臨床質問応答、免疫組織化学(IHC)パネルレコメンデーション、単一アーキテクチャ内での迅速な報告変換を可能にする。
PathoScribeは,70,000の多施設の外科病理報告に基づいて,自然言語の症例検索に完璧なRecall@10を達成し,高品質な検索接地推論(平均4.56/5)を実証した。
批判的に、このシステムは、自由テキストの適格基準による自動コーホート構築を運用し、人間のレビュアーに対して91.3%の同意を得て、従来の手作業によるチャートレビューと比較して、時間とコストのオーダー・オブ・マグニチュードの削減を代表して不正に除外された。
この研究は、パッシブストレージシステムからデジタル病理資料をアクティブな臨床知能プラットフォームに変換するためのスケーラブルな基盤を確立する。
関連論文リスト
- Intelligent Documentation in Medical Education: Can AI Replace Manual Case Logging? [1.3266402517619373]
手続き的なケースログは、放射線学のトレーニングのコア要件であるが、完成には時間がかかり、手作業で作成する場合には一貫性が低下する。
本研究では,大規模言語モデル (LLM) が自由テキストラジオグラフィーレポートから直接,手続き的ケースログの文書化を自動化できるかどうかを検討する。
論文 参考訳(メタデータ) (2026-01-19T01:45:51Z) - MedDialogRubrics: A Comprehensive Benchmark and Evaluation Framework for Multi-turn Medical Consultations in Large Language Models [15.91764739198419]
5,200件の患者と6万件以上のきめ細粒度評価ルーブリックからなる新規なベンチマークであるMedDialogRubricsについて紹介する。
本フレームワークでは,実世界の電子的健康記録にアクセスすることなく,現実的な患者記録と主訴を合成するマルチエージェントシステムを採用している。
論文 参考訳(メタデータ) (2026-01-06T13:56:33Z) - MedForget: Hierarchy-Aware Multimodal Unlearning Testbed for Medical AI [66.0701326117134]
MedForgetは、階層型を意識したマルチモーダルなアンラーニングテストベッドで、準拠する医療AIシステムを構築する。
既存の手法は,診断性能を低下させることなく,完全かつ階層性に配慮した忘れの解決に苦慮していることを示す。
階層レベルのコンテキストをプロンプトに徐々に追加する再構成攻撃を導入する。
論文 参考訳(メタデータ) (2025-12-10T17:55:06Z) - Retrieval-Augmented Generation Assistant for Anatomical Pathology Laboratories [2.125786478579275]
本研究は,解剖学(AP)研究室に適合したRAGアシスタントの提案と評価である。
ポルトガルの医療機関から99個のAPプロトコルの新たなコーパスを収集し、323個の質問応答ペアを構築した。
Retrieval-Augmented Generationアシスタントは、プロトコル関連のクエリに対するコンテキストグラウンドの回答を提供する。
論文 参考訳(メタデータ) (2025-12-08T22:44:57Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - A Systematic Review of Natural Language Processing Applied to Radiology
Reports [3.600747505433814]
本研究は, 放射線学報告に応用されたNLPの最近の文献を体系的に評価する。
本研究は, 放射線学的特徴, nlp法, 性能, 研究, 臨床応用特性を含む21の変数に基づく。
論文 参考訳(メタデータ) (2021-02-18T18:54:41Z) - Hierarchical Reinforcement Learning for Automatic Disease Diagnosis [52.111516253474285]
政策学習のための対話システムに2段階の階層的な政策構造を統合することを提案する。
提案した政策構造は,多くの疾患や症状を含む診断問題に対処することができる。
論文 参考訳(メタデータ) (2020-04-29T15:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。