論文の概要: Hierarchical attention interpretation: an interpretable speech-level
transformer for bi-modal depression detection
- arxiv url: http://arxiv.org/abs/2309.13476v2
- Date: Fri, 6 Oct 2023 11:46:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 03:18:21.392327
- Title: Hierarchical attention interpretation: an interpretable speech-level
transformer for bi-modal depression detection
- Title(参考訳): 階層的注意解釈:バイモーダル抑うつ検出のための解釈可能な音声レベルトランスフォーマー
- Authors: Qingkun Deng, Saturnino Luz, Sofia de la Fuente Garcia
- Abstract要約: うつ病は一般的な精神疾患である。機械学習によって実現された音声を用いた自動うつ病検出ツールは、うつ病の早期スクリーニングに役立つ。
本稿では、セグメントレベルのラベリングによるノイズと、モデル解釈可能性の欠如という、そのようなツールの臨床的実装を妨げる可能性のある2つの制限に対処する。
- 参考スコア(独自算出の注目度): 6.561362931802501
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depression is a common mental disorder. Automatic depression detection tools
using speech, enabled by machine learning, help early screening of depression.
This paper addresses two limitations that may hinder the clinical
implementations of such tools: noise resulting from segment-level labelling and
a lack of model interpretability. We propose a bi-modal speech-level
transformer to avoid segment-level labelling and introduce a hierarchical
interpretation approach to provide both speech-level and sentence-level
interpretations, based on gradient-weighted attention maps derived from all
attention layers to track interactions between input features. We show that the
proposed model outperforms a model that learns at a segment level ($p$=0.854,
$r$=0.947, $F1$=0.897 compared to $p$=0.732, $r$=0.808, $F1$=0.768). For model
interpretation, using one true positive sample, we show which sentences within
a given speech are most relevant to depression detection; and which text tokens
and Mel-spectrogram regions within these sentences are most relevant to
depression detection. These interpretations allow clinicians to verify the
validity of predictions made by depression detection tools, promoting their
clinical implementations.
- Abstract(参考訳): うつ病は一般的な精神疾患です。
機械学習によって実現される音声を用いた自動うつ病検出ツールは、うつ病の早期スクリーニングに役立つ。
本稿では, セグメントレベルのラベリングによるノイズとモデル解釈性の欠如という, 臨床実装を妨げる可能性のある2つの制限について述べる。
本稿では,セグメント単位のラベリングを回避し,全ての注意層から導かれた勾配重み付き注意マップに基づく音声レベルと文レベルの両方の解釈を行い,入力特徴間の相互作用を追跡する階層的解釈手法を提案する。
提案モデルは,セグメントレベルで学習するモデル(p$=0.854,$r$=0.947,$f1$=0.897,$p$=0.732,$r$=0.808,$f1$=0.768)よりも優れていることを示す。
モデル解釈では、一つの正のサンプルを用いて、どの文が抑うつ検出に最も関連しているか、どのテキストトークンとメルスペクトログラム領域が抑うつ検出に最も関係しているかを示す。
これらの解釈により、臨床医はうつ病検出ツールによる予測の有効性を検証でき、臨床実施を促進することができる。
関連論文リスト
- Robust and Explainable Depression Identification from Speech Using Vowel-Based Ensemble Learning Approaches [5.102770724328495]
本研究では、音声から抑うつを識別するための説明可能な機械学習アルゴリズムについて検討する。
個別の患者健康アンケート8(PHQ-8)項目スコアを予測する8つのモデルを備えたボットアップアプローチと、うつ病を評価するルータモジュールを備えたMixture of Experts(MoE)を用いた"トップダウン"アプローチである。
どちらの手法も最先端のベースラインに匹敵するパフォーマンスを描いており、平均/中間値のデータセットに対する重大さと感受性の低下を示している。
論文 参考訳(メタデータ) (2024-10-23T22:03:09Z) - Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - A BERT-Based Summarization approach for depression detection [1.7363112470483526]
うつ病は世界中で流行する精神疾患であり、対処されないと深刻な反感を引き起こす可能性がある。
機械学習と人工知能は、さまざまなデータソースからのうつ病指標を自律的に検出することができる。
本研究では,入力テキストの長さと複雑さを低減させる前処理手法として,テキスト要約を提案する。
論文 参考訳(メタデータ) (2024-09-13T02:14:34Z) - Predicting Individual Depression Symptoms from Acoustic Features During Speech [8.592847632589692]
現在の自動うつ病検出システムは、臨床うつ病評価尺度で示されるうつ病の個々の症状や症状に頼ることなく、直接予測を提供する。
本研究では,最後の抑うつ予測を得る前に,音声の音響的特徴を用いて抑うつ評価尺度の個々の項目を予測する。
論文 参考訳(メタデータ) (2024-06-23T03:26:47Z) - The Relationship Between Speech Features Changes When You Get Depressed:
Feature Correlations for Improving Speed and Performance of Depression
Detection [69.88072583383085]
この研究は、抑うつが音声から抽出した特徴間の相関を変化させることを示す。
このような洞察を用いることで、SVMとLSTMに基づく抑うつ検出器のトレーニング速度と性能を向上させることができる。
論文 参考訳(メタデータ) (2023-07-06T09:54:35Z) - Depression detection in social media posts using affective and social
norm features [84.12658971655253]
ソーシャルメディア投稿からの抑うつ検出のための奥深いアーキテクチャを提案する。
我々は、後期融合方式を用いて、ポストとワードの敬称と道徳的特徴をアーキテクチャに組み込んだ。
提案された機能を含めると、両方の設定で最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-03-24T21:26:27Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z) - Detecting Hallucinated Content in Conditional Neural Sequence Generation [165.68948078624499]
出力シーケンスの各トークンが(入力に含まれていない)幻覚化されているかどうかを予測するタスクを提案する。
また、合成データに微調整された事前学習言語モデルを用いて幻覚を検出する方法についても紹介する。
論文 参考訳(メタデータ) (2020-11-05T00:18:53Z) - Multimodal Depression Severity Prediction from medical bio-markers using
Machine Learning Tools and Technologies [0.0]
うつ病は世界中の精神疾患の主要な原因となっている。
近年,うつ病の診断とステージ予測の自動化に行動的手がかりが用いられている。
ラベル付き行動データセットの欠如と、膨大な量のバリエーションが、タスクを達成する上で大きな課題であることが証明されている。
論文 参考訳(メタデータ) (2020-09-11T20:44:28Z) - Affective Conditioning on Hierarchical Networks applied to Depression
Detection from Transcribed Clinical Interviews [0.0]
抑うつは、被験者の気分だけでなく、言語の使用にも影響を及ぼす精神障害である。
我々は階層的注意ネットワークを用いて抑うつ者のインタビューを分類する。
我々は,情緒的レキシカから抽出した言語的特徴の条件付け機構により,モデルの注意層を増強する。
論文 参考訳(メタデータ) (2020-06-04T20:55:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。