論文の概要: Building Safe and Deployable Clinical Natural Language Processing under Temporal Leakage Constraints
- arxiv url: http://arxiv.org/abs/2602.15852v2
- Date: Thu, 19 Feb 2026 02:13:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 12:01:13.651151
- Title: Building Safe and Deployable Clinical Natural Language Processing under Temporal Leakage Constraints
- Title(参考訳): テンポラルリーク制約下における安全かつデプロイ可能な自然言語処理の構築
- Authors: Ha Na Cho, Sairam Sutari, Alexander Lopez, Hansen Bow, Kai Zheng,
- Abstract要約: 本研究は, 時間的リーク制約の下で安全かつデプロイ可能なNLPを構築するために必要なシステムレベルの設計選択に焦点を当てた。
モデル開発プロセスに解釈可能性を統合する軽量な監査パイプラインを提案し,最終訓練前の漏洩信号の同定と抑制を行う。
その結果, 監査されたモデルの方が, より保守的でキャリブレーションのよい推定値を示し, 放電関連語彙的手がかりへの依存度を低下させることがわかった。
- 参考スコア(独自算出の注目度): 39.44014654945035
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical natural language processing (NLP) models have shown promise for supporting hospital discharge planning by leveraging narrative clinical documentation. However, note-based models are particularly vulnerable to temporal and lexical leakage, where documentation artifacts encode future clinical decisions and inflate apparent predictive performance. Such behavior poses substantial risks for real-world deployment, where overconfident or temporally invalid predictions can disrupt clinical workflows and compromise patient safety. This study focuses on system-level design choices required to build safe and deployable clinical NLP under temporal leakage constraints. We present a lightweight auditing pipeline that integrates interpretability into the model development process to identify and suppress leakage-prone signals prior to final training. Using next-day discharge prediction after elective spine surgery as a case study, we evaluate how auditing affects predictive behavior, calibration, and safety-relevant trade-offs. Results show that audited models exhibit more conservative and better-calibrated probability estimates, with reduced reliance on discharge-related lexical cues. These findings emphasize that deployment-ready clinical NLP systems should prioritize temporal validity, calibration, and behavioral robustness over optimistic performance.
- Abstract(参考訳): 臨床自然言語処理(NLP)モデルは、物語的臨床文献を活用することで、退院計画を支援することを約束している。
しかし、ノートベースのモデルは、特に時間的および語彙的な漏洩に対して脆弱であり、文書は将来の臨床上の決定を符号化し、明らかな予測性能を増大させる。
このような行動は、過度に自信または時間的に無効な予測が臨床ワークフローを妨害し、患者の安全を損なう、現実世界の展開に重大なリスクをもたらす。
本研究は, 時間的リーク制約の下で安全かつデプロイ可能なNLPを構築するために必要なシステムレベルの設計選択に焦点を当てた。
モデル開発プロセスに解釈可能性を統合する軽量な監査パイプラインを提案し,最終訓練前の漏洩信号の同定と抑制を行う。
選択的脊椎手術後の翌日放電予測を事例として, 監査が予測行動, 校正, 安全関連トレードオフに与える影響を評価する。
その結果, 監査されたモデルの方が, より保守的でキャリブレーションのよい推定値を示し, 放電関連語彙的手がかりへの依存度を低下させることがわかった。
これらの結果から,NLPシステムは,楽観的性能よりも時間的妥当性,校正,行動的堅牢性を優先すべきであることが示唆された。
関連論文リスト
- An Empirical Analysis of Calibration and Selective Prediction in Multimodal Clinical Condition Classification [11.640422721732756]
マルチラベル臨床条件分類における不確実性に基づく選択予測の信頼性を実証的に評価した。
高い標準評価基準にもかかわらず、選択的予測は性能を著しく低下させる可能性がある。
この失敗は、厳密なクラス依存の誤校正によって引き起こされ、モデルが正しい予測に高い不確実性を割り当て、誤った予測に低い不確実性を割り当てる。
論文 参考訳(メタデータ) (2026-03-03T08:16:44Z) - Calibrated Bayesian Deep Learning for Explainable Decision Support Systems Based on Medical Imaging [6.826979426009301]
モデルが予測精度と相関する方法で不確実性を定量化し、臨床医がさらなるレビューのために信頼できないアウトプットを特定できることが不可欠である。
本稿では,ベイズ深層学習に基づく一般化可能な確率的最適化フレームワークを提案する。
特に、信頼性・不確実性境界損失(CUB-Loss)が新しく導入され、高い精度の誤差と低い精度の正確な予測に罰則が課せられる。
提案手法は, 肺炎の自動スクリーニング, 糖尿病性網膜症検出, 皮膚病変の同定という, 3つの異なる医用画像処理課題に対して検証された。
論文 参考訳(メタデータ) (2026-02-12T14:03:41Z) - Stable Prediction of Adverse Events in Medical Time-Series Data [18.92202613147342]
早期事象予測(EEP)システムは、臨床意思決定を支援するための患者の差し迫ったリスクを継続的に見積もる。
本稿では,マルチモーダル入力EHR,ECG波形,臨床テキストを用いたEEPベンチマークであるCAREBenchを紹介する。
本稿では,患者ごとの短期変動を定量化し,局所リプシッツ定数に基づいて急激な振動をペナリゼーションする安定性指標を提案する。
論文 参考訳(メタデータ) (2025-10-16T04:16:54Z) - Evidential time-to-event prediction with calibrated uncertainty quantification [12.446406577462069]
Time-to-event分析は、臨床予後と治療勧告に関する洞察を提供する。
本稿では,時間とイベントの予測に特化して設計された明らかな回帰モデルを提案する。
我々のモデルは正確かつ信頼性の高い性能を提供し、最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-11-12T15:06:04Z) - SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - Improving Robustness and Reliability in Medical Image Classification with Latent-Guided Diffusion and Nested-Ensembles [4.249986624493547]
一度展開すると、医用画像解析法は予期せぬ画像の破損やノイズの摂動に直面することが多い。
LaDiNEは、視覚変換器のロバスト性と拡散に基づく生成モデルを組み合わせた、新しいアンサンブル学習手法である。
結核胸部X線とメラノーマ皮膚がんデータセットの実験により、LaDiNEは幅広い最先端の方法と比較して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-10-24T15:53:07Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - When in Doubt: Neural Non-Parametric Uncertainty Quantification for
Epidemic Forecasting [70.54920804222031]
既存の予測モデルは不確実な定量化を無視し、誤校正予測をもたらす。
不確実性を考慮した時系列予測のためのディープニューラルネットワークの最近の研究にもいくつかの制限がある。
本稿では,予測タスクを確率的生成過程としてモデル化し,EPIFNPと呼ばれる機能的ニューラルプロセスモデルを提案する。
論文 参考訳(メタデータ) (2021-06-07T18:31:47Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。