論文の概要: Linguistic Blind Spots in Clinical Decision Extraction
- arxiv url: http://arxiv.org/abs/2602.03942v1
- Date: Tue, 03 Feb 2026 19:04:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.23817
- Title: Linguistic Blind Spots in Clinical Decision Extraction
- Title(参考訳): 臨床診断における言語学的ブラインドスポット
- Authors: Mohamed Elgaar, Hadi Amiri,
- Abstract要約: 薬物関連および問題定義決定は、エンティティ・センスとテレグラフィである。
助言的・予防的な決定は、より物語的であり、より高い停止語と代名詞比率を含んでいる。
- 参考スコア(独自算出の注目度): 15.942130010323128
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting medical decisions from clinical notes is a key step for clinical decision support and patient-facing care summaries. We study how the linguistic characteristics of clinical decisions vary across decision categories and whether these differences explain extraction failures. Using MedDec discharge summaries annotated with decision categories from the Decision Identification and Classification Taxonomy for Use in Medicine (DICTUM), we compute seven linguistic indices for each decision span and analyze span-level extraction recall of a standard transformer model. We find clear category-specific signatures: drug-related and problem-defining decisions are entity-dense and telegraphic, whereas advice and precaution decisions contain more narrative, with higher stopword and pronoun proportions and more frequent hedging and negation cues. On the validation split, exact-match recall is 48%, with large gaps across linguistic strata: recall drops from 58% to 24% from the lowest to highest stopword-proportion bins, and spans containing hedging or negation cues are less likely to be recovered. Under a relaxed overlap-based match criterion, recall increases to 71%, indicating that many errors are span boundary disagreements rather than complete misses. Overall, narrative-style spans--common in advice and precaution decisions--are a consistent blind spot under exact matching, suggesting that downstream systems should incorporate boundary-tolerant evaluation and extraction strategies for clinical decisions.
- Abstract(参考訳): 臨床ノートから医学的意思決定を抽出することは、臨床的意思決定支援と患者が直面するケアサマリーにとって重要なステップである。
臨床的決定の言語的特徴は, カテゴリーによって異なるが, これらの違いが抽出失敗を説明できるかどうかを考察する。
DICTUM (Decision Identification and Classification Taxonomy for Use in Medicine) から決定カテゴリに注釈を付した MedDec の放電サマリーを用いて, 決定範囲毎に7つの言語指標を算出し, 標準変圧器モデルのスパンレベル抽出リコールを解析する。
薬物関連および問題定義決定はエンティティデンスとテレグラフィであり、アドバイスと予防決定はより多くの物語を含み、より高い停止語と代名詞比とより頻繁なヘッジと否定の手がかりを含んでいる。
バリデーション分割では、正確なマッチリコールは48%であり、言語層間で大きなギャップがあり、リコールは最低から最高まで58%から24%まで減少し、ヘッジや否定の手がかりを含むスパンは回収されにくい。
緩和されたオーバーラップベースの一致基準の下では、リコールは71%増加し、多くのエラーは完全なミスよりも境界不一致にまたがっていることを示す。
全体としては、アドバイスや予防判断において一般的な物語スタイルのスパンは、正確なマッチングの下で一貫した盲点であり、下流システムは臨床決定のために境界寛容な評価と抽出戦略を組み込むべきであることを示唆している。
関連論文リスト
- AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - A Consequentialist Critique of Binary Classification Evaluation Practices [4.603739046972463]
ICML、FAccT、CHILといった主要なカンファレンスでは、トップKメトリクスや一定のしきい値が好まれています。
我々は、この決定論的フレームワークを使用して、評価指標を最適なユースケースにマッピングし、Pythonパッケージであるbriertoolsとともに、より広範なBrierスコアの採用を促進する。
論文 参考訳(メタデータ) (2025-04-06T15:58:01Z) - GEMA-Score: Granular Explainable Multi-Agent Scoring Framework for Radiology Report Evaluation [7.838068874909676]
Granular Explainable Multi-Agent Score (GEMA-Score)は、大規模言語モデルに基づくマルチエージェントワークフローを通じて、客観的および主観的評価を行う。
GEMA-Scoreは、公開データセット上での人間の専門家評価と最も高い相関を達成している。
論文 参考訳(メタデータ) (2025-03-07T11:42:22Z) - SPA: Efficient User-Preference Alignment against Uncertainty in Medical Image Segmentation [10.871259365539087]
医用画像セグメンテーションデータの不確かさは、ラベル付けの好みにおける不完全な画像品質と可変性に起因する可能性がある。
textbfSPA(textbfSegmentation textbfPreference textbfAlignment framework)を提案する。
SPAは,1)既存の対話的セグメンテーションアプローチと比較して,ユーザ時間と労力の大幅な削減,2)人間のフィードバックに基づく強い適応性,3)異なる画像モダリティとセマンティックラベルをまたいだ最先端の画像セグメンテーション性能を示す。
論文 参考訳(メタデータ) (2024-11-23T10:27:08Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Making the Most Out of the Limited Context Length: Predictive Power
Varies with Clinical Note Type and Note Section [70.37720062263176]
本研究では,高い予測力で区間を解析する枠組みを提案する。
MIMIC-IIIを用いて,(1)看護用音符と退院用音符とでは予測電力分布が異なること,(2)文脈長が大きい場合の音符の組み合わせにより性能が向上することが示唆された。
論文 参考訳(メタデータ) (2023-07-13T20:04:05Z) - Language Model Classifier Aligns Better with Physician Word Sensitivity
than XGBoost on Readmission Prediction [86.15787587540132]
語彙レベルでモデルの振る舞いを精査する尺度である感度スコアを導入する。
本実験は,感度スコアのランク相関に基づいて,臨床医と分類医の意思決定論理を比較した。
論文 参考訳(メタデータ) (2022-11-13T23:59:11Z) - Finding Regions of Heterogeneity in Decision-Making via Expected
Conditional Covariance [3.9775905909091804]
本稿では,意思決定者間不一致度の高いコンテキストのタイプを同定するアルゴリズムを提案する。
我々はこれを因果推論問題として定式化し、意思決定者の委任が決定に因果関係に大きな影響を及ぼす地域を求める。
われわれのアルゴリズムを実世界の医療データセットに適用し、既存の臨床知識と整合した変動を回復する。
論文 参考訳(メタデータ) (2021-10-27T15:20:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。