論文の概要: Why Do Self-Harm Prediction Models Struggle to Generalise? Lexical and Semantic Variations in Emergency Department Triage Notes
- arxiv url: http://arxiv.org/abs/2606.01678v1
- Date: Mon, 01 Jun 2026 04:37:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.985829
- Title: Why Do Self-Harm Prediction Models Struggle to Generalise? Lexical and Semantic Variations in Emergency Department Triage Notes
- Title(参考訳): セルフ・ハーム予測モデルが一般化を妨げている理由 : 救急省トリアージノートにおける語彙的・意味的変動
- Authors: Liuliu Chen, Mike Conway, Jo Robinson, Vlada Rozova,
- Abstract要約: 救急部門へのセルフハームプレゼンテーションは、自殺リスクの増大と強く関連している。
2つの病院のEDトリアージノートを,語彙的特徴,関連性の高い予測的特徴,有能なトピックを分析して比較した。
自爆や自傷などの一貫したテーマに拘わらず, 病院内における語彙表現の変動と, 自傷に関する特徴的重要性を明らかにした。
- 参考スコア(独自算出の注目度): 0.9039665244779184
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-harm presentations to emergency departments (EDs) are strongly associated with higher suicide risk. NLP models have shown robust performance in detecting self-harm from triage notes within single hospitals, yet performance often declines across institutions. To examine potential causes, we compare ED triage notes from two hospitals by analyzing lexical characteristics, highly associated predictive features, and salient topics. Our results reveal variation in lexical expression and feature importance related to self-harm across hospitals, despite consistent core themes such as self-poisoning and self-injury. These documentation differences are associated with reduced cross-site performance. Our findings provide insight into how institutional variation affects the identification of self-harm in clinical text and highlight potential methods to improve model generalisability.
- Abstract(参考訳): 救急部門へのセルフハームプレゼンテーションは、自殺リスクの増大と強く関連している。
NLPモデルは、単一の病院内のトリアージノートから自己損傷を検出する上で堅牢な性能を示しているが、施設間では性能が低下することが多い。
本研究は,2つの病院のEDトリアージノートを,語彙的特徴,関連性の高い予測的特徴,有能なトピックを分析して比較した。
自爆や自傷などの一貫したテーマに拘わらず, 病院内における語彙表現の変動と, 自傷に関する特徴的重要性を明らかにした。
これらのドキュメントの違いは、クロスサイトパフォーマンスの低下に関連している。
本研究は, 臨床テキスト中の自己ハームの同定に制度的変動がどう影響するかを考察し, モデル汎用性向上のための潜在的方法を強調した。
関連論文リスト
- Benchmarking Egocentric Clinical Intent Understanding Capability for Medical Multimodal Large Language Models [48.95516224614331]
MedGaze-Benchは、臨床医の視線を認知的カーソルとして活用し、手術、緊急シミュレーション、診断解釈における意図的理解を評価する最初のベンチマークである。
本ベンチマークでは,解剖学的構造の視覚的均一性,臨床における時間・因果依存性の厳格化,安全プロトコルへの暗黙の順守という3つの基本的な課題に対処する。
論文 参考訳(メタデータ) (2026-01-11T02:20:40Z) - Assessing the robustness of heterogeneous treatment effects in survival analysis under informative censoring [50.164756034797136]
臨床研究ではドロップアウトが一般的で、副作用やその他の理由で患者の半数以上が早期に退院する。
ドロップアウトが有益な場合、治療効果の推定値にもバイアスがかかるため、検閲バイアスが導入される。
検閲バイアスに直面した場合の生存分析における条件平均処理効果推定のロバスト性を評価するための仮定リーンフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-15T10:51:17Z) - MEDEQUALQA: Evaluating Biases in LLMs with Counterfactual Reasoning [7.167933033102407]
重篤な症状と症状を一定に保ちながら,患者代名詞のみを摂動する反ファクト・ベンチマークであるMEDEQUALQAを紹介する。
我々は、GPT-4.1モデルを評価し、代名詞の変種間の安定性を測定するために、推論トレース間のセマンティックテキスト類似性(STS)を計算する。
以上の結果から,総じて高い類似性(平均STS >0.80)を示した。
論文 参考訳(メタデータ) (2025-10-09T22:12:58Z) - The Personality Illusion: Revealing Dissociation Between Self-Reports & Behavior in LLMs [60.15472325639723]
人格特性は、人間の行動の予測因子として長い間研究されてきた。
近年のLarge Language Models (LLM) は, 人工システムに類似したパターンが出現する可能性を示唆している。
論文 参考訳(メタデータ) (2025-09-03T21:27:10Z) - DeVisE: Behavioral Testing of Medical Large Language Models [14.832083455439749]
DeVisEは、きめ細かい臨床的理解を求めるための行動テストフレームワークである。
我々はMIMIC-IVからICU排出音符のデータセットを構築した。
汎用型および医療用微調整型にまたがる5種類のLSMについて検討した。
論文 参考訳(メタデータ) (2025-06-18T10:42:22Z) - Secure Diagnostics: Adversarial Robustness Meets Clinical Interpretability [9.522045116604358]
医用画像分類のためのディープニューラルネットワークは、臨床実践において一貫して一般化することができないことが多い。
本稿では, フラクチャー検出のために微調整された深部ニューラルネットワークの解釈可能性について, 対向攻撃に対するモデル性能の評価により検討する。
論文 参考訳(メタデータ) (2025-04-07T20:26:02Z) - Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8396086718266]
自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文 参考訳(メタデータ) (2024-04-18T12:33:57Z) - Mortality Prediction Models with Clinical Notes Using Sparse Attention
at the Word and Sentence Levels [2.335152769484957]
臨床神経予測モデルにおける注意機構について,その識別と校正の観点から検討した。
具体的には, 病院内死亡予測の課題において, 重み付けの代替としてスパース・アテンションを考察した。
スパース機構のアプローチは、公開データセットによる予測性能において、局所的な自己アテンションにおいて、密な自己アテンションよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-12T22:08:45Z) - Making sense of violence risk predictions using clinical notes [0.988455728566886]
精神医学施設における暴力リスク評価は、介入によって暴力事件を避けることができる。
これまでの研究では、そのようなノートを用いて精神科患者の暴力リスクを許容できるパフォーマンスで評価しようと試みてきた。
論文 参考訳(メタデータ) (2022-04-29T10:00:07Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。