論文の概要: Uncovering Misattributed Suicide Causes through Annotation Inconsistency Detection in Death Investigation Notes
- arxiv url: http://arxiv.org/abs/2403.19432v2
- Date: Fri, 29 Mar 2024 17:21:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-01 11:08:03.390468
- Title: Uncovering Misattributed Suicide Causes through Annotation Inconsistency Detection in Death Investigation Notes
- Title(参考訳): 死亡調査ノートにおける注釈の不整合検出による自殺原因の発見
- Authors: Song Wang, Yiliang Zhou, Ziqiang Han, Cui Tao, Yunyu Xiao, Ying Ding, Joydeep Ghosh, Yifan Peng,
- Abstract要約: NVDRS(National Violent Death Reporting System)のデータは、死のパターンや原因を発見するために広く利用されている。
最近の研究では、NVDRS内のアノテーションの不整合と誤った自殺原因の帰属に対する潜在的影響が示唆されている。
本稿では,アノテーションの不整合を検知し,問題のあるインスタンスを識別するクロスバリデーションのようなパラダイムを採用する,経験的自然言語処理(NLP)アプローチを提案する。
- 参考スコア(独自算出の注目度): 21.374488755816092
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data accuracy is essential for scientific research and policy development. The National Violent Death Reporting System (NVDRS) data is widely used for discovering the patterns and causes of death. Recent studies suggested the annotation inconsistencies within the NVDRS and the potential impact on erroneous suicide-cause attributions. We present an empirical Natural Language Processing (NLP) approach to detect annotation inconsistencies and adopt a cross-validation-like paradigm to identify problematic instances. We analyzed 267,804 suicide death incidents between 2003 and 2020 from the NVDRS. Our results showed that incorporating the target state's data into training the suicide-crisis classifier brought an increase of 5.4% to the F-1 score on the target state's test set and a decrease of 1.1% on other states' test set. To conclude, we demonstrated the annotation inconsistencies in NVDRS's death investigation notes, identified problematic instances, evaluated the effectiveness of correcting problematic instances, and eventually proposed an NLP improvement solution.
- Abstract(参考訳): データ正確性は科学研究と政策開発に不可欠である。
NVDRS(National Violent Death Reporting System)のデータは、死のパターンや原因を発見するために広く利用されている。
最近の研究では、NVDRS内のアノテーションの不整合と誤った自殺原因の帰属に対する潜在的影響が示唆されている。
本稿では,アノテーションの不整合を検知し,問題のある事例を識別するためにクロスバリデーションのようなパラダイムを採用する,経験的自然言語処理(NLP)アプローチを提案する。
2003年から2020年にかけての267,804件の自殺事故をNVDRSから分析した。
その結果, 目標状態のデータを訓練に組み込むことで, 目標状態のF-1得点が5.4%増加し, 他状態のF-1得点が1.1%減少した。
結論として,NVDRSの死亡調査ノートにおけるアノテーションの不整合を実証し,問題事例を特定し,問題事例の修正の有効性を評価し,最終的にNLP改善ソリューションを提案した。
関連論文リスト
- Statistically Significant $k$NNAD by Selective Inference [12.703556860454565]
kNNADを含む異常検出における重要な課題は、検出された異常の信頼性を適切に定量化することである。
統計的仮説テストとしてkNNADを定式化し、$p$-valuesを用いて偽検出の確率を定量化する。
SIを利用することで、Stat-kNNAD法は検出された異常が理論的保証とともに統計的に有意であることを保証する。
論文 参考訳(メタデータ) (2025-02-18T15:58:58Z) - Not All Errors Are Equal: Investigation of Speech Recognition Errors in Alzheimer's Disease Detection [62.942077348224046]
アルツハイマー病(AD)の自動診断における音声認識の役割
近年の研究では,単語誤り率(WER)とAD検出性能の非線形関係が明らかにされている。
本研究は,BERTを用いたAD検出システムにおけるASR転写誤りの影響について,一連の解析を行った。
論文 参考訳(メタデータ) (2024-12-09T09:32:20Z) - Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8396086718266]
自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文 参考訳(メタデータ) (2024-04-18T12:33:57Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - GAIA: Delving into Gradient-based Attribution Abnormality for
Out-of-distribution Detection [40.07502368794068]
In-distriion(ID)データとout-of-distriion(OOD)データの相違を定量化するための革新的な視点を提供する。
OOD検出にはゼロデフレ異常とチャネルワイド平均異常の2種類の異常を導入する。
GAIAの有効性は、一般的に使用されるCIFARと大規模(ImageNet-1k)ベンチマークの両方で検証される。
論文 参考訳(メタデータ) (2023-11-16T07:05:12Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Leveraging Contextual Relatedness to Identify Suicide Documentation in
Clinical Notes through Zero Shot Learning [8.57098973963918]
本稿では,ゼロショット学習を通じて,このデータ空間の問題に対処することにより,臨床ノートの自殺を識別する新しい手法について述べる。
深層ニューラルネットワークは、トレーニング文書の内容を意味空間にマッピングすることで訓練された。
この手法は0.90の確率閾値を適用し、自殺を記録したICD 10 CMコードと関係のないメモを94%の精度で特定した。
論文 参考訳(メタデータ) (2023-01-09T17:26:07Z) - Am I No Good? Towards Detecting Perceived Burdensomeness and Thwarted
Belongingness from Suicide Notes [51.378225388679425]
本稿では,自殺ノートから知覚的バーデンサムネス(PB)とThwarted Belongingness(TB)を検出する新しい課題に対処するエンドツーエンドマルチタスクシステムを提案する。
また、ベンチマークCEASE-v2.0データセットに基づいて、手動で翻訳したコード混合自殺メモコーパス、CoMCEASE-v2.0を導入する。
自殺ノートの時間方向と感情情報を利用して全体のパフォーマンスを向上する。
論文 参考訳(メタデータ) (2022-05-20T06:31:08Z) - Unsupervised neural adaptation model based on optimal transport for
spoken language identification [54.96267179988487]
トレーニングセットとテストセット間の音響音声の統計的分布のミスマッチにより,音声言語識別(SLID)の性能が大幅に低下する可能性がある。
SLIDの分布ミスマッチ問題に対処するために,教師なしニューラル適応モデルを提案する。
論文 参考訳(メタデータ) (2020-12-24T07:37:19Z) - DNA Methylation Data to Predict Suicidal and Non-Suicidal Deaths: A
Machine Learning Approach [1.2891210250935146]
本研究の目的は,最新の機械学習アルゴリズムを用いてDNAメチル化データから自殺死・非自殺死を予測することである。
サポートベクターマシンを用いて,メチル化DNAプローブ強度の正規化値からなる既存の二次データを分類した。
クロスバリデーションを用いたにもかかわらず、BA11データに対する自殺死の予測は名目上完全なものであり、モデルの過度な適合の可能性を示している。
論文 参考訳(メタデータ) (2020-04-04T00:34:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。