論文の概要: A Practical Guide Towards Interpreting Time-Series Deep Clinical Predictive Models: A Reproducibility Study
- arxiv url: http://arxiv.org/abs/2603.24828v1
- Date: Wed, 25 Mar 2026 21:33:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:47.995772
- Title: A Practical Guide Towards Interpreting Time-Series Deep Clinical Predictive Models: A Reproducibility Study
- Title(参考訳): 時系列深部臨床予測モデル解釈のための実践的ガイド:再現性の検討
- Authors: Yongda Fan, John Wu, Andrea Fitzpatrick, Naveen Baskaran, Jimeng Sun, Adam Cross,
- Abstract要約: 本稿では,様々な臨床予測タスクとモデルアーキテクチャの相互解釈可能性の評価を行う。
本分析により,モデル予測を忠実に解釈する手法として,適切に活用した場合の注意が極めて効率的であることが判明した。
いくつかの解釈可能性アプローチは信頼できないので信頼できない。
- 参考スコア(独自算出の注目度): 13.086799883102634
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical decisions are high-stakes and require explicit justification, making model interpretability essential for auditing deep clinical models prior to deployment. As the ecosystem of model architectures and explainability methods expands, critical questions remain: Do architectural features like attention improve explainability? Do interpretability approaches generalize across clinical tasks? While prior benchmarking efforts exist, they often lack extensibility and reproducibility, and critically, fail to systematically examine how interpretability varies across the interplay of clinical tasks and model architectures. To address these gaps, we present a comprehensive benchmark evaluating interpretability methods across diverse clinical prediction tasks and model architectures. Our analysis reveals that: (1) attention when leveraged properly is a highly efficient approach for faithfully interpreting model predictions; (2) black-box interpreters like KernelSHAP and LIME are computationally infeasible for time-series clinical prediction tasks; and (3) several interpretability approaches are too unreliable to be trustworthy. From our findings, we discuss several guidelines on improving interpretability within clinical predictive pipelines. To support reproducibility and extensibility, we provide our implementations via PyHealth, a well-documented open-source framework: https://github.com/sunlabuiuc/PyHealth.
- Abstract(参考訳): 臨床決定は高い判断であり、明示的な正当化を必要とするため、モデル解釈可能性は、デプロイ前に深い臨床モデルを監査するために不可欠である。
モデルアーキテクチャと説明可能性メソッドのエコシステムが拡大するにつれ、重要な疑問が残る。
解釈可能性のアプローチは臨床的タスク全体にわたって一般化されるか?
事前のベンチマーク作業は存在するが、拡張性や再現性に欠けることが多く、重要なことに、臨床タスクやモデルアーキテクチャの相互運用において、解釈可能性がどのように変化するかを体系的に検証することができない。
これらのギャップに対処するために、様々な臨床予測タスクとモデルアーキテクチャの相互解釈可能性の評価手法を総合的なベンチマークで評価する。
分析の結果,(1)適切に活用された場合の注意は,モデル予測を忠実に解釈するための極めて効率的なアプローチであり,(2)KernelSHAPやLIMEのようなブラックボックスインタプリタは,時系列臨床予測タスクでは計算不可能であり,(3)信頼性の低いいくつかの解釈可能性アプローチは信頼できないことが判明した。
そこで本研究では,臨床予測パイプラインにおける解釈可能性の向上に関するガイドラインについて考察した。
再現性と拡張性をサポートするため、よくドキュメント化されたオープンソースフレームワークであるPyHealthを通じて実装を提供しています。
関連論文リスト
- ClinStructor: AI-Powered Structuring of Unstructured Clinical Texts [3.073796943975155]
我々は,ClinStructorについて述べる。ClinStructorは大規模言語モデル(LLM)を利用して,臨床自由テキストを予測モデルに先立って構造化されたタスク固有の質問応答ペアに変換するパイプラインである。
本手法は透明性と制御性を大幅に向上させ,予測性能の低下を招く。
論文 参考訳(メタデータ) (2025-11-14T21:21:16Z) - Building Trust in Clinical LLMs: Bias Analysis and Dataset Transparency [3.097915343305639]
臨床言語モデルにおける下流バイアスの詳細な分析について述べる。
我々は、民族、性別、年齢など、多様な人口集団にまたがる異なるオピオイド処方の傾向に注目した。
HC4: Healthcare Comprehensive Commons Corpusを紹介します。
論文 参考訳(メタデータ) (2025-10-21T12:08:39Z) - Interpretable Clinical Classification with Kolgomorov-Arnold Networks [70.72819760172744]
Kolmogorov-Arnold Networks (KAN) は、透明で象徴的な表現を通じて固有の解釈能力を提供する。
Kansは、組み込みの患者レベルの洞察、直感的な可視化、最寄りの患者の検索をサポートする。
これらの結果は、カンを、臨床医が理解し、監査し、行動できる信頼できるAIへの有望なステップと位置づけている。
論文 参考訳(メタデータ) (2025-09-20T17:21:58Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。
我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-12T09:03:30Z) - Will Large Language Models Transform Clinical Prediction? [6.239284099493876]
大規模言語モデル(LLM)は、医療への関心が高まっている。
本解説は,臨床予測モデル(CPM)を診断・予後タスクに応用するためのLSMの可能性を評価するものである。
論文 参考訳(メタデータ) (2025-05-23T17:02:04Z) - Secure Diagnostics: Adversarial Robustness Meets Clinical Interpretability [9.522045116604358]
医用画像分類のためのディープニューラルネットワークは、臨床実践において一貫して一般化することができないことが多い。
本稿では, フラクチャー検出のために微調整された深部ニューラルネットワークの解釈可能性について, 対向攻撃に対するモデル性能の評価により検討する。
論文 参考訳(メタデータ) (2025-04-07T20:26:02Z) - SemioLLM: Evaluating Large Language Models for Diagnostic Reasoning from Unstructured Clinical Narratives in Epilepsy [45.2233252981348]
臨床知識を符号化するための言語モデル(LLM)が示されている。
6つの最先端モデルをベンチマークする評価フレームワークであるSemioLLMを提案する。
ほとんどのLSMは、脳内の発作発生領域の確率的予測を正確かつ確実に生成できることを示す。
論文 参考訳(メタデータ) (2024-07-03T11:02:12Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。