論文の概要: Hierarchical attention interpretation: an interpretable speech-level
transformer for bi-modal depression detection
- arxiv url: http://arxiv.org/abs/2309.13476v2
- Date: Fri, 6 Oct 2023 11:46:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 03:18:21.392327
- Title: Hierarchical attention interpretation: an interpretable speech-level
transformer for bi-modal depression detection
- Title(参考訳): 階層的注意解釈:バイモーダル抑うつ検出のための解釈可能な音声レベルトランスフォーマー
- Authors: Qingkun Deng, Saturnino Luz, Sofia de la Fuente Garcia
- Abstract要約: うつ病は一般的な精神疾患である。機械学習によって実現された音声を用いた自動うつ病検出ツールは、うつ病の早期スクリーニングに役立つ。
本稿では、セグメントレベルのラベリングによるノイズと、モデル解釈可能性の欠如という、そのようなツールの臨床的実装を妨げる可能性のある2つの制限に対処する。
- 参考スコア(独自算出の注目度): 6.561362931802501
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depression is a common mental disorder. Automatic depression detection tools
using speech, enabled by machine learning, help early screening of depression.
This paper addresses two limitations that may hinder the clinical
implementations of such tools: noise resulting from segment-level labelling and
a lack of model interpretability. We propose a bi-modal speech-level
transformer to avoid segment-level labelling and introduce a hierarchical
interpretation approach to provide both speech-level and sentence-level
interpretations, based on gradient-weighted attention maps derived from all
attention layers to track interactions between input features. We show that the
proposed model outperforms a model that learns at a segment level ($p$=0.854,
$r$=0.947, $F1$=0.897 compared to $p$=0.732, $r$=0.808, $F1$=0.768). For model
interpretation, using one true positive sample, we show which sentences within
a given speech are most relevant to depression detection; and which text tokens
and Mel-spectrogram regions within these sentences are most relevant to
depression detection. These interpretations allow clinicians to verify the
validity of predictions made by depression detection tools, promoting their
clinical implementations.
- Abstract(参考訳): うつ病は一般的な精神疾患です。
機械学習によって実現される音声を用いた自動うつ病検出ツールは、うつ病の早期スクリーニングに役立つ。
本稿では, セグメントレベルのラベリングによるノイズとモデル解釈性の欠如という, 臨床実装を妨げる可能性のある2つの制限について述べる。
本稿では,セグメント単位のラベリングを回避し,全ての注意層から導かれた勾配重み付き注意マップに基づく音声レベルと文レベルの両方の解釈を行い,入力特徴間の相互作用を追跡する階層的解釈手法を提案する。
提案モデルは,セグメントレベルで学習するモデル(p$=0.854,$r$=0.947,$f1$=0.897,$p$=0.732,$r$=0.808,$f1$=0.768)よりも優れていることを示す。
モデル解釈では、一つの正のサンプルを用いて、どの文が抑うつ検出に最も関連しているか、どのテキストトークンとメルスペクトログラム領域が抑うつ検出に最も関係しているかを示す。
これらの解釈により、臨床医はうつ病検出ツールによる予測の有効性を検証でき、臨床実施を促進することができる。
関連論文リスト
- Predicting Individual Depression Symptoms from Acoustic Features During Speech [8.592847632589692]
現在の自動うつ病検出システムは、臨床うつ病評価尺度で示されるうつ病の個々の症状や症状に頼ることなく、直接予測を提供する。
本研究では,最後の抑うつ予測を得る前に,音声の音響的特徴を用いて抑うつ評価尺度の個々の項目を予測する。
論文 参考訳(メタデータ) (2024-06-23T03:26:47Z) - DepressionEmo: A novel dataset for multilabel classification of
depression emotions [6.26397257917403]
DepressionEmoは、Redditの長いユーザー投稿の6037例によって、うつ病に関連する8つの感情を検出するために設計されたデータセットである。
このデータセットは、事前訓練されたモデルのゼロショット分類による入力に対する多数決によって作成された。
本稿では,SVM,XGBoost,Light GBMなどの機械学習手法と,BERT,GAN-BERT,BARTなどのディープラーニング手法の2つのグループに分類されるテキスト分類手法を提案する。
論文 参考訳(メタデータ) (2024-01-09T16:25:31Z) - Identifying depression-related topics in smartphone-collected
free-response speech recordings using an automatic speech recognition system
and a deep learning topic model [7.825530847570242]
参加者265人を対象に,3919件のスマートフォンによる音声録音で29項目を抽出した。
PHQ-8の中央値が10以上の6つのトピックがうつ病のリスクトピックとみなされた。
また, 話題変化とうつ病重症度の変化との関係について検討した。
論文 参考訳(メタデータ) (2023-08-22T20:30:59Z) - The Relationship Between Speech Features Changes When You Get Depressed:
Feature Correlations for Improving Speed and Performance of Depression
Detection [69.88072583383085]
この研究は、抑うつが音声から抽出した特徴間の相関を変化させることを示す。
このような洞察を用いることで、SVMとLSTMに基づく抑うつ検出器のトレーニング速度と性能を向上させることができる。
論文 参考訳(メタデータ) (2023-07-06T09:54:35Z) - Depression detection in social media posts using affective and social
norm features [84.12658971655253]
ソーシャルメディア投稿からの抑うつ検出のための奥深いアーキテクチャを提案する。
我々は、後期融合方式を用いて、ポストとワードの敬称と道徳的特徴をアーキテクチャに組み込んだ。
提案された機能を含めると、両方の設定で最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-03-24T21:26:27Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Speaker Embedding-aware Neural Diarization for Flexible Number of
Speakers with Textual Information [55.75018546938499]
本稿では,話者埋め込み認識型ニューラルダイアリゼーション(SEND)手法を提案する。
本手法は,ターゲット話者の音声活動検出よりも低いダイアリゼーション誤差率を実現する。
論文 参考訳(メタデータ) (2021-11-28T12:51:04Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z) - Detecting Hallucinated Content in Conditional Neural Sequence Generation [165.68948078624499]
出力シーケンスの各トークンが(入力に含まれていない)幻覚化されているかどうかを予測するタスクを提案する。
また、合成データに微調整された事前学習言語モデルを用いて幻覚を検出する方法についても紹介する。
論文 参考訳(メタデータ) (2020-11-05T00:18:53Z) - Multimodal Depression Severity Prediction from medical bio-markers using
Machine Learning Tools and Technologies [0.0]
うつ病は世界中の精神疾患の主要な原因となっている。
近年,うつ病の診断とステージ予測の自動化に行動的手がかりが用いられている。
ラベル付き行動データセットの欠如と、膨大な量のバリエーションが、タスクを達成する上で大きな課題であることが証明されている。
論文 参考訳(メタデータ) (2020-09-11T20:44:28Z) - Affective Conditioning on Hierarchical Networks applied to Depression
Detection from Transcribed Clinical Interviews [0.0]
抑うつは、被験者の気分だけでなく、言語の使用にも影響を及ぼす精神障害である。
我々は階層的注意ネットワークを用いて抑うつ者のインタビューを分類する。
我々は,情緒的レキシカから抽出した言語的特徴の条件付け機構により,モデルの注意層を増強する。
論文 参考訳(メタデータ) (2020-06-04T20:55:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。