論文の概要: Uncovering Misattributed Suicide Causes through Annotation Inconsistency Detection in Death Investigation Notes
- arxiv url: http://arxiv.org/abs/2403.19432v1
- Date: Thu, 28 Mar 2024 14:03:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-29 16:04:18.914789
- Title: Uncovering Misattributed Suicide Causes through Annotation Inconsistency Detection in Death Investigation Notes
- Title(参考訳): 死亡調査ノートにおける注釈の不整合検出による自殺原因の発見
- Authors: Song Wang, Yiliang Zhou, Ziqiang Han, Cui Tao, Yunyu Xiao, Ying Ding, Joydeep Ghosh, Yifan Peng,
- Abstract要約: NVDRS(National Violent Death Reporting System)のデータは、死のパターンや原因を発見するために広く利用されている。
最近の研究では、NVDRS内のアノテーションの不整合と誤った自殺原因の帰属に対する潜在的影響が示唆されている。
本稿では,アノテーションの不整合を検知し,問題のあるインスタンスを識別するクロスバリデーションのようなパラダイムを採用する,経験的自然言語処理(NLP)アプローチを提案する。
- 参考スコア(独自算出の注目度): 21.374488755816092
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data accuracy is essential for scientific research and policy development. The National Violent Death Reporting System (NVDRS) data is widely used for discovering the patterns and causes of death. Recent studies suggested the annotation inconsistencies within the NVDRS and the potential impact on erroneous suicide-cause attributions. We present an empirical Natural Language Processing (NLP) approach to detect annotation inconsistencies and adopt a cross-validation-like paradigm to identify problematic instances. We analyzed 267,804 suicide death incidents between 2003 and 2020 from the NVDRS. Our results showed that incorporating the target state's data into training the suicide-crisis classifier brought an increase of 5.4% to the F-1 score on the target state's test set and a decrease of 1.1% on other states' test set. To conclude, we demonstrated the annotation inconsistencies in NVDRS's death investigation notes, identified problematic instances, evaluated the effectiveness of correcting problematic instances, and eventually proposed an NLP improvement solution.
- Abstract(参考訳): データ正確性は科学研究と政策開発に不可欠である。
NVDRS(National Violent Death Reporting System)のデータは、死のパターンや原因を発見するために広く利用されている。
最近の研究では、NVDRS内のアノテーションの不整合と誤った自殺原因の帰属に対する潜在的影響が示唆されている。
本稿では,アノテーションの不整合を検知し,問題のある事例を識別するためにクロスバリデーションのようなパラダイムを採用する,経験的自然言語処理(NLP)アプローチを提案する。
2003年から2020年にかけての267,804件の自殺事故をNVDRSから分析した。
その結果, 目標状態のデータを訓練に組み込むことで, 目標状態のF-1得点が5.4%増加し, 他状態のF-1得点が1.1%減少した。
結論として,NVDRSの死亡調査ノートにおけるアノテーションの不整合を実証し,問題事例を特定し,問題事例の修正の有効性を評価し,最終的にNLP改善ソリューションを提案した。
関連論文リスト
- Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8396086718266]
自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文 参考訳(メタデータ) (2024-04-18T12:33:57Z) - Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting [55.17761802332469]
テスト時間適応(TTA)は、与えられたモデルw.r.t.を任意のテストサンプルに適用することにより、トレーニングデータとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
事前の手法は各テストサンプルに対してバックプロパゲーションを実行するため、多くのアプリケーションに対して許容できない最適化コストがかかる。
本稿では, 有効サンプル選択基準を策定し, 信頼性および非冗長なサンプルを同定する, 効率的なアンチフォッティングテスト時間適応法を提案する。
論文 参考訳(メタデータ) (2024-03-18T05:49:45Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - GAIA: Delving into Gradient-based Attribution Abnormality for
Out-of-distribution Detection [40.07502368794068]
In-distriion(ID)データとout-of-distriion(OOD)データの相違を定量化するための革新的な視点を提供する。
OOD検出にはゼロデフレ異常とチャネルワイド平均異常の2種類の異常を導入する。
GAIAの有効性は、一般的に使用されるCIFARと大規模(ImageNet-1k)ベンチマークの両方で検証される。
論文 参考訳(メタデータ) (2023-11-16T07:05:12Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Leveraging Contextual Relatedness to Identify Suicide Documentation in
Clinical Notes through Zero Shot Learning [8.57098973963918]
本稿では,ゼロショット学習を通じて,このデータ空間の問題に対処することにより,臨床ノートの自殺を識別する新しい手法について述べる。
深層ニューラルネットワークは、トレーニング文書の内容を意味空間にマッピングすることで訓練された。
この手法は0.90の確率閾値を適用し、自殺を記録したICD 10 CMコードと関係のないメモを94%の精度で特定した。
論文 参考訳(メタデータ) (2023-01-09T17:26:07Z) - Am I No Good? Towards Detecting Perceived Burdensomeness and Thwarted
Belongingness from Suicide Notes [51.378225388679425]
本稿では,自殺ノートから知覚的バーデンサムネス(PB)とThwarted Belongingness(TB)を検出する新しい課題に対処するエンドツーエンドマルチタスクシステムを提案する。
また、ベンチマークCEASE-v2.0データセットに基づいて、手動で翻訳したコード混合自殺メモコーパス、CoMCEASE-v2.0を導入する。
自殺ノートの時間方向と感情情報を利用して全体のパフォーマンスを向上する。
論文 参考訳(メタデータ) (2022-05-20T06:31:08Z) - Filter Drug-induced Liver Injury Literature with Natural Language
Processing and Ensemble Learning [0.0]
薬物性肝障害 (DILI) は、肝臓を損傷する薬物の副作用である。
重度DILI症例では肝不全や死亡などの生命予後も報告された。
過去の出版物からのデータ抽出は手動ラベリングに大きく依存している。
バイオメディカルテキストの自動処理を可能にする人工知能の最近の進歩
論文 参考訳(メタデータ) (2022-03-09T23:53:07Z) - Unsupervised neural adaptation model based on optimal transport for
spoken language identification [54.96267179988487]
トレーニングセットとテストセット間の音響音声の統計的分布のミスマッチにより,音声言語識別(SLID)の性能が大幅に低下する可能性がある。
SLIDの分布ミスマッチ問題に対処するために,教師なしニューラル適応モデルを提案する。
論文 参考訳(メタデータ) (2020-12-24T07:37:19Z) - DNA Methylation Data to Predict Suicidal and Non-Suicidal Deaths: A
Machine Learning Approach [1.2891210250935146]
本研究の目的は,最新の機械学習アルゴリズムを用いてDNAメチル化データから自殺死・非自殺死を予測することである。
サポートベクターマシンを用いて,メチル化DNAプローブ強度の正規化値からなる既存の二次データを分類した。
クロスバリデーションを用いたにもかかわらず、BA11データに対する自殺死の予測は名目上完全なものであり、モデルの過度な適合の可能性を示している。
論文 参考訳(メタデータ) (2020-04-04T00:34:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。