論文の概要: Identifying depression-related topics in smartphone-collected
free-response speech recordings using an automatic speech recognition system
and a deep learning topic model
- arxiv url: http://arxiv.org/abs/2308.11773v1
- Date: Tue, 22 Aug 2023 20:30:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 16:45:25.097609
- Title: Identifying depression-related topics in smartphone-collected
free-response speech recordings using an automatic speech recognition system
and a deep learning topic model
- Title(参考訳): 自動音声認識システムとディープラーニングモデルを用いたスマートフォンによる自由応答音声記録における抑うつ関連トピックの同定
- Authors: Yuezhou Zhang, Amos A Folarin, Judith Dineley, Pauline Conde, Valeria
de Angel, Shaoxiong Sun, Yatharth Ranjan, Zulqarnain Rashid, Callum Stewart,
Petroula Laiou, Heet Sankesara, Linglong Qian, Faith Matcham, Katie M White,
Carolin Oetzmann, Femke Lamers, Sara Siddi, Sara Simblett, Bj\"orn W.
Schuller, Srinivasan Vairavan, Til Wykes, Josep Maria Haro, Brenda WJH
Penninx, Vaibhav A Narayan, Matthew Hotopf, Richard JB Dobson, Nicholas
Cummins, RADAR-CNS consortium
- Abstract要約: 参加者265人を対象に,3919件のスマートフォンによる音声録音で29項目を抽出した。
PHQ-8の中央値が10以上の6つのトピックがうつ病のリスクトピックとみなされた。
また, 話題変化とうつ病重症度の変化との関係について検討した。
- 参考スコア(独自算出の注目度): 7.825530847570242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Language use has been shown to correlate with depression, but large-scale
validation is needed. Traditional methods like clinic studies are expensive.
So, natural language processing has been employed on social media to predict
depression, but limitations remain-lack of validated labels, biased user
samples, and no context. Our study identified 29 topics in 3919
smartphone-collected speech recordings from 265 participants using the Whisper
tool and BERTopic model. Six topics with a median PHQ-8 greater than or equal
to 10 were regarded as risk topics for depression: No Expectations, Sleep,
Mental Therapy, Haircut, Studying, and Coursework. To elucidate the topic
emergence and associations with depression, we compared behavioral (from
wearables) and linguistic characteristics across identified topics. The
correlation between topic shifts and changes in depression severity over time
was also investigated, indicating the importance of longitudinally monitoring
language use. We also tested the BERTopic model on a similar smaller dataset
(356 speech recordings from 57 participants), obtaining some consistent
results. In summary, our findings demonstrate specific speech topics may
indicate depression severity. The presented data-driven workflow provides a
practical approach to collecting and analyzing large-scale speech data from
real-world settings for digital health research.
- Abstract(参考訳): 言語使用は抑うつと相関することが示されているが、大規模な検証が必要である。
臨床研究のような伝統的な方法は高価です。
そのため、ソーシャルメディアでは抑うつを予測するために自然言語処理が採用されているが、検証済みラベル、バイアス付きユーザーサンプル、コンテキストの制限は残っていない。
調査では,WhisperツールとBERTopicモデルを用いて,265人のスマートフォンによる音声記録3919件中29件を抽出した。
PHQ-8の中央値が10以上の6つのトピックは、期待、睡眠、精神療法、ヘアカット、学習、コースワークといったうつ病のリスクトピックとみなされた。
うつ病の出現と関連性を明らかにするため,特定トピック間での行動的特徴と言語的特徴を比較した。
また, トピックシフトとうつ病重症度の変化との関係についても検討し, 言語使用の縦断的モニタリングの重要性を示唆した。
また, BERTopicモデルについても, 57名の参加者の音声記録356件を対象に実験を行い, 一貫性のある結果を得た。
要約すると,特定の音声話題はうつ病の重篤さを示す可能性がある。
提示されたデータ駆動ワークフローは、デジタルヘルス研究のための現実世界の設定から大規模な音声データを収集し分析するための実践的なアプローチを提供する。
関連論文リスト
- Language-Agnostic Analysis of Speech Depression Detection [2.5764071253486636]
本研究は、英語とマラヤラムの2言語間での自動抑うつ検出を解析する。
CNNモデルは、両言語に焦点をあてて、抑うつに関連する音響的特徴を特定するために訓練される。
その結果,言語に依存しない抑うつ検出システムの開発に寄与する可能性が示唆された。
論文 参考訳(メタデータ) (2024-09-23T07:35:56Z) - Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models [50.40276881893513]
本研究では,音声大言語モデル(SLLM)における社会的バイアスの評価を目的としたデータセットであるSpken Stereosetを紹介する。
多様な人口集団の発話に対して異なるモデルがどのように反応するかを調べることで、これらのバイアスを特定することを目指している。
これらの結果から,ほとんどのモデルではバイアスが最小であるが,ステレオタイプや反ステレオタイプ傾向がわずかにみられた。
論文 参考訳(メタデータ) (2024-08-14T16:55:06Z) - DAIC-WOZ: On the Validity of Using the Therapist's prompts in Automatic Depression Detection from Clinical Interviews [39.08557916089242]
近年の研究では、インタビュアーのプロンプトをモデルに組み込んだ場合の性能向上が報告されている。
インタビュアーのプロンプトを用いたモデルでは,過去のメンタルヘルス問題に関する質問が質問されるインタビューの特定の領域に焦点を絞ることが分かる。
故意に利用することで0.90F1のスコアを得ることができ、このデータセットで報告された最も高い結果は、テキスト情報のみを用いてである。
論文 参考訳(メタデータ) (2024-04-22T09:07:50Z) - Hierarchical attention interpretation: an interpretable speech-level
transformer for bi-modal depression detection [6.561362931802501]
うつ病は一般的な精神疾患である。機械学習によって実現された音声を用いた自動うつ病検出ツールは、うつ病の早期スクリーニングに役立つ。
本稿では、セグメントレベルのラベリングによるノイズと、モデル解釈可能性の欠如という、そのようなツールの臨床的実装を妨げる可能性のある2つの制限に対処する。
論文 参考訳(メタデータ) (2023-09-23T20:48:58Z) - The Relationship Between Speech Features Changes When You Get Depressed:
Feature Correlations for Improving Speed and Performance of Depression
Detection [69.88072583383085]
この研究は、抑うつが音声から抽出した特徴間の相関を変化させることを示す。
このような洞察を用いることで、SVMとLSTMに基づく抑うつ検出器のトレーニング速度と性能を向上させることができる。
論文 参考訳(メタデータ) (2023-07-06T09:54:35Z) - Depression detection in social media posts using affective and social
norm features [84.12658971655253]
ソーシャルメディア投稿からの抑うつ検出のための奥深いアーキテクチャを提案する。
我々は、後期融合方式を用いて、ポストとワードの敬称と道徳的特徴をアーキテクチャに組み込んだ。
提案された機能を含めると、両方の設定で最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-03-24T21:26:27Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - A Psychologically Informed Part-of-Speech Analysis of Depression in
Social Media [1.7188280334580193]
私たちは、Early Risk Prediction on the Internet Workshop (eRisk) 2018のうつ病データセットを使用します。
その結果, うつ病者と非うつ病者の間に統計的に有意な差が認められた。
我々の研究は、抑うつした個人がソーシャルメディアプラットフォーム上で自己表現している方法に関する洞察を提供する。
論文 参考訳(メタデータ) (2021-07-31T16:23:22Z) - "Notic My Speech" -- Blending Speech Patterns With Multimedia [65.91370924641862]
音声認識と理解における視点依存と視覚的重要性の両方をモデル化するための視点時間的注意機構を提案する。
提案手法は, ビセム誤差率において, 既存の作業よりも4.99%優れていた。
モデルでは,多視点音声に対する理解と人間の知覚との間に強い相関関係があることが示されている。
論文 参考訳(メタデータ) (2020-06-12T06:51:55Z) - Affective Conditioning on Hierarchical Networks applied to Depression
Detection from Transcribed Clinical Interviews [0.0]
抑うつは、被験者の気分だけでなく、言語の使用にも影響を及ぼす精神障害である。
我々は階層的注意ネットワークを用いて抑うつ者のインタビューを分類する。
我々は,情緒的レキシカから抽出した言語的特徴の条件付け機構により,モデルの注意層を増強する。
論文 参考訳(メタデータ) (2020-06-04T20:55:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。