論文の概要: Before the Labels: How Dataset Construction Shapes Suicidality Detection in Clinical Text
- arxiv url: http://arxiv.org/abs/2606.19637v1
- Date: Wed, 17 Jun 2026 22:31:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.567765
- Title: Before the Labels: How Dataset Construction Shapes Suicidality Detection in Clinical Text
- Title(参考訳): ラベル前:臨床テキストにおけるデータセット構築の適切な検出方法
- Authors: Priyanshi Garg, Ishita Rao, Jieqiong Ding, Amandalynne Paullada,
- Abstract要約: 我々は,ガバナンスの制約,ICDに基づくコホート選択,単一アノテーションラベリング,病院レベルのアグリゲーションが,臨床医の判断を反映したラベルをいかに生み出すかを示す。
言語学的分析により、同一のラベルが時間性、否定性、不確実性が異なる異種臨床フレーミングを仮定していることが示されている。
- 参考スコア(独自算出の注目度): 0.5483653499671707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical NLP increasingly relies on electronic health record (EHR) data to detect suicidal behaviors, treating clinical documentation as more reliable ground truth than social media. We argue that this framing obscures how EHR-based suicidality datasets encode a particular operationalization of suicidality, shaped by who authors the data, how episodes are bounded, and how ambiguity is resolved. We ground this argument in a case study of the ScAN dataset, built over MIMIC-III clinical notes. We show how governance constraints, ICD-based cohort selection, single-annotator labeling, and hospital-stay-level aggregation produce labels that reflect clinician-documented judgments, treat suicidality as a bounded episode, and assume that intent can be reliably inferred from documentation. A linguistic analysis demonstrates that identical labels subsume heterogeneous clinical framings differing in temporality, negation, and uncertainty. We argue that clinical NLP should examine the assumptions embedded in suicidality datasets before interpreting their labels as ground truth.
- Abstract(参考訳): 臨床NLPは、自殺行動を検出するために電子健康記録(EHR)データにますます依存しており、臨床文書はソーシャルメディアよりも信頼できる根拠として扱われている。
このフレーミングは、EHRベースの自殺データセットが、誰がデータを書いたか、エピソードがどのように境界付けられているか、そしてあいまいさがどう解決されるかによって、特定の自殺行為をコード化しているかを曖昧にしている、と我々は主張する。
この主張は、MIMIC-III 臨床ノート上に構築された ScAN データセットのケーススタディに基礎を置いている。
ガバナンスの制約、ICDベースのコホート選択、単一アノテーションラベリング、病院レベルのアグリゲーションが、臨床医による文書化された判断を反映し、自殺を境界エピソードとして扱い、意図がドキュメントから確実に推測できると仮定するラベルをいかに生み出しているかを示す。
言語学的分析により、同一のラベルが時間性、否定性、不確実性が異なる異種臨床フレーミングを仮定していることが示されている。
臨床NLPは、ラベルを基礎的真理と解釈する前に、自殺データセットに埋め込まれた仮定を調べるべきであると論じる。
関連論文リスト
- Beyond Scalar Scores: Exploring LLM-based Metrics for Clinical Significance Evaluation in Radiology Reports [49.5225801722164]
既存のメトリクスは、医学的に根拠のないスカラーにレポートの品質を低下させることによって、この要件を曖昧にしている。
テストベッドとしてReEvalMedベンチマークを用いて,この境界について検討し,計量レベルの臨床的意義を評価する。
論文 参考訳(メタデータ) (2026-06-17T08:10:30Z) - CT-FineBench: A Diagnostic Fidelity Benchmark for Fine-Grained Evaluation of CT Report Generation [51.11942945171396]
従来の評価指標は、語彙重なり合いやエンティティマッチングの粗い尺度のみを提供する。
我々はCT-RATEとMerlinのベンチマークであるCT-FineBenchを提案し、CTレポートの微細な事実整合性を評価する。
我々のベンチマークは、綿密な質問回答(QA)ベースのプロセスによって構築されます。
論文 参考訳(メタデータ) (2026-04-27T03:32:46Z) - Agentic Cognitive Profiling: Realigning Automated Alzheimer's Disease Detection with Clinical Construct Validity [66.94391219005291]
本稿では,臨床プロトコルロジックによる自動スクリーニングを実現するエージェント認知プロファイリング(ACP)を提案する。
我々の設計の中心は、すべての定量化を決定論的関数呼び出しに委譲することで、測定から意味的理解を分離することである。
ACPは、タスク試験で90.5%のスコアマッチ率、AD予測で85.3%の精度を達成し、一般的な基準を上回っている。
論文 参考訳(メタデータ) (2026-03-18T06:15:35Z) - Anonpsy: A Graph-Based Framework for Structure-Preserving De-identification of Psychiatric Narratives [1.4652274443334974]
我々は、タスクをグラフ誘導セマンティックリライトとして再構成する非識別フレームワークであるAnonpsyを紹介した。
解剖学は、各物語を臨床的実体、時間的アンカー、型付き関係をコードする意味グラフに変換する。
専門家、セマンティクス、GPT-5に基づく評価の下で、診断の正確性を維持しながら、常に低い再識別リスクを達成している。
論文 参考訳(メタデータ) (2026-01-20T01:37:44Z) - Multi-Label Classification with Generative AI Models in Healthcare: A Case Study of Suicidality and Risk Factors [9.89999399520808]
本研究では、自殺関連因子(SrFs)の多ラベル分類(MLC)における生成型大規模言語モデル(LLMs)、特にGPT-3.5およびGPT-4.5の使用について検討する。
本稿では,新しいエンドツーエンド生成パイプラインを提案するとともに,ラベルセットレベルのメトリクスや,エラー解析のためのマルチラベル混同行列など,高度な評価手法を提案する。
本研究は,SIとSAの融合などの系統的誤りパターンを明らかにし,ラベル付けに慎重な傾向を示す。
論文 参考訳(メタデータ) (2025-07-22T20:44:44Z) - GEMA-Score: Granular Explainable Multi-Agent Scoring Framework for Radiology Report Evaluation [7.838068874909676]
Granular Explainable Multi-Agent Score (GEMA-Score)は、大規模言語モデルに基づくマルチエージェントワークフローを通じて、客観的および主観的評価を行う。
GEMA-Scoreは、公開データセット上での人間の専門家評価と最も高い相関を達成している。
論文 参考訳(メタデータ) (2025-03-07T11:42:22Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Leveraging Contextual Relatedness to Identify Suicide Documentation in
Clinical Notes through Zero Shot Learning [8.57098973963918]
本稿では,ゼロショット学習を通じて,このデータ空間の問題に対処することにより,臨床ノートの自殺を識別する新しい手法について述べる。
深層ニューラルネットワークは、トレーニング文書の内容を意味空間にマッピングすることで訓練された。
この手法は0.90の確率閾値を適用し、自殺を記録したICD 10 CMコードと関係のないメモを94%の精度で特定した。
論文 参考訳(メタデータ) (2023-01-09T17:26:07Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。