論文の概要: Your Model Is Not Predicting Depression Well And That Is Why: A Case
Study of PRIMATE Dataset
- arxiv url: http://arxiv.org/abs/2403.00438v1
- Date: Fri, 1 Mar 2024 10:47:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 17:37:46.104223
- Title: Your Model Is Not Predicting Depression Well And That Is Why: A Case
Study of PRIMATE Dataset
- Title(参考訳): あなたのモデルはうつ病をよく予測していない。その理由:PRIMATEデータセットのケーススタディ
- Authors: Kirill Milintsevich (1 and 2), Kairit Sirts (2), Ga\"el Dias (1) ((1)
University of Caen Normandy, (2) University of Tartu)
- Abstract要約: ソーシャルメディアのテキストからNLPに基づく抑うつレベル推定に使用されるメンタルヘルスデータセットのアノテーションの品質について検討する。
本研究は,アノテーションの妥当性,特に関心の欠如や快楽症状に対する懸念を明らかにする。
Data Use Agreementの下でリリースされる当社の洗練されたアノテーションは、アンヘドニア検出のための高品質なテストセットを提供します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the quality of annotations in mental health datasets
used for NLP-based depression level estimation from social media texts. While
previous research relies on social media-based datasets annotated with binary
categories, i.e. depressed or non-depressed, recent datasets such as D2S and
PRIMATE aim for nuanced annotations using PHQ-9 symptoms. However, most of
these datasets rely on crowd workers without the domain knowledge for
annotation. Focusing on the PRIMATE dataset, our study reveals concerns
regarding annotation validity, particularly for the lack of interest or
pleasure symptom. Through reannotation by a mental health professional, we
introduce finer labels and textual spans as evidence, identifying a notable
number of false positives. Our refined annotations, to be released under a Data
Use Agreement, offer a higher-quality test set for anhedonia detection. This
study underscores the necessity of addressing annotation quality issues in
mental health datasets, advocating for improved methodologies to enhance NLP
model reliability in mental health assessments.
- Abstract(参考訳): ソーシャルメディアのテキストからNLPに基づく抑うつレベル推定に用いるメンタルヘルスデータセットのアノテーションの品質について検討する。
以前の研究では、二項分類に注釈付けされたソーシャルメディアベースのデータセット、すなわち、うつ病または非うつ病のデータセットに依存していたが、D2SやPRIMATEといった最近のデータセットは、PHQ-9の症状を用いたニュアンスドアノテーションを目指している。
しかし、これらのデータセットのほとんどは、アノテーションのドメイン知識のないクラウドワーカーに依存している。
本研究は,PRIMATEデータセットに着目し,特に関心の欠如や快楽症状に対するアノテーションの妥当性に関する懸念を明らかにする。
メンタルヘルスの専門家による再注釈を通して、より細かいラベルやテキストスパンを証拠として紹介し、注目すべき偽陽性数を識別する。
データ使用契約の下でリリース予定の洗練されたアノテーションは、anhedonia検出のための高品質なテストセットを提供します。
本研究は、メンタルヘルスデータセットにおけるアノテーションの品質問題に対処する必要性を強調し、メンタルヘルスアセスメントにおけるNLPモデルの信頼性を高める方法の改善を提唱する。
関連論文リスト
- A BERT-Based Summarization approach for depression detection [1.7363112470483526]
うつ病は世界中で流行する精神疾患であり、対処されないと深刻な反感を引き起こす可能性がある。
機械学習と人工知能は、さまざまなデータソースからのうつ病指標を自律的に検出することができる。
本研究では,入力テキストの長さと複雑さを低減させる前処理手法として,テキスト要約を提案する。
論文 参考訳(メタデータ) (2024-09-13T02:14:34Z) - Depression Detection on Social Media with Large Language Models [23.075317886505193]
抑うつ検出は、ソーシャルメディア上の投稿履歴を分析して、個人が抑うつに苦しむかどうかを判断することを目的としている。
本稿では,医学的知識と大規模言語モデルの最近の進歩を融合した,DORISと呼ばれる新規なうつ病検出システムを提案する。
論文 参考訳(メタデータ) (2024-03-16T01:01:16Z) - DepreSym: A Depression Symptom Annotated Corpus and the Role of LLMs as
Assessors of Psychological Markers [3.5511184956329727]
DepreSym データセットは Beck Depression Inventory-II 症状に関連する21580 文からなる。
このデータセットは、臨床症状などのうつ病マーカーを組み込んだモデルの開発を進めるための貴重なリソースとなる。
論文 参考訳(メタデータ) (2023-08-21T14:44:31Z) - Depression detection in social media posts using affective and social
norm features [84.12658971655253]
ソーシャルメディア投稿からの抑うつ検出のための奥深いアーキテクチャを提案する。
我々は、後期融合方式を用いて、ポストとワードの敬称と道徳的特徴をアーキテクチャに組み込んだ。
提案された機能を含めると、両方の設定で最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-03-24T21:26:27Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - DEPTWEET: A Typology for Social Media Texts to Detect Depression
Severities [0.46796109436086664]
我々はうつ病の重症度を検出するために,うつ病の臨床的記述を活用してソーシャルメディアテキストのタイプロジを構築する。
精神疾患の診断・統計マニュアル(DSM-5)と患者健康アンケート(PHQ-9)の標準的臨床評価手順をエミュレートする
専門家アノテータによってラベル付けされた40191ツイートの新しいデータセットを提示します。それぞれのツイートは、"non-depressed"あるいは"depressed"とラベル付けされます。
論文 参考訳(メタデータ) (2022-10-10T08:23:57Z) - Annotation Error Detection: Analyzing the Past and Present for a More
Coherent Future [63.99570204416711]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。
アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。
私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文 参考訳(メタデータ) (2022-06-05T22:31:45Z) - Journaling Data for Daily PHQ-2 Depression Prediction and Forecasting [47.93070579578704]
我々は,新たに収集した時系列データセット上で,アクティブに収集されたデータを用いて,毎日のPHQ-2スコアを予測し,予測する可能性を探る。
PHQ-2 スコアの日次予測には 1.417 の MAE が最適である。
これは、うつ病モニタリングアプリケーションにアクティブに収集されたデータを組み込むことで得られる付加価値を示す。
論文 参考訳(メタデータ) (2022-05-06T17:47:05Z) - Data set creation and empirical analysis for detecting signs of
depression from social media postings [0.0]
うつ病は、深刻な結果を避けるために、早期に検出され治療されなければならない一般的な精神疾患である。
我々は、ソーシャルメディアの投稿から、うつ病のレベルが落ち込んでいないこと、中程度に落ち込んでいないこと、および深刻な落ち込んでいないことを検知する、金の標準データセットを開発した。
論文 参考訳(メタデータ) (2022-02-07T10:24:33Z) - Learning Language and Multimodal Privacy-Preserving Markers of Mood from
Mobile Data [74.60507696087966]
精神状態は、先進医療に共通する国でも診断されていない。
人間の行動を監視するための有望なデータソースのひとつは、日々のスマートフォンの利用だ。
本研究では,自殺行動のリスクが高い青少年集団の移動行動のデータセットを用いて,日常生活の行動マーカーについて検討した。
論文 参考訳(メタデータ) (2021-06-24T17:46:03Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。