論文の概要: Attention-Based Acoustic Feature Fusion Network for Depression Detection
- arxiv url: http://arxiv.org/abs/2308.12478v1
- Date: Thu, 24 Aug 2023 00:31:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 15:58:30.062493
- Title: Attention-Based Acoustic Feature Fusion Network for Depression Detection
- Title(参考訳): 抑うつ検出のための注意型音響特徴融合ネットワーク
- Authors: Xiao Xu, Yang Wang, Xinru Wei, Fei Wang, Xizhe Zhang
- Abstract要約: 抑うつ検出のためのアテンションベース音響特徴融合ネットワーク(ABAFnet)を提案する。
ABAFnetは、4つの異なる音響特徴を包括的ディープラーニングモデルに組み合わせ、多層的特徴を効果的に統合し、ブレンドする。
本稿では,これらの特徴を効果的に合成することにより,性能を向上する,遅延核融合のための新しい重量調整モジュールを提案する。
- 参考スコア(独自算出の注目度): 11.972591489278988
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depression, a common mental disorder, significantly influences individuals
and imposes considerable societal impacts. The complexity and heterogeneity of
the disorder necessitate prompt and effective detection, which nonetheless,
poses a difficult challenge. This situation highlights an urgent requirement
for improved detection methods. Exploiting auditory data through advanced
machine learning paradigms presents promising research directions. Yet,
existing techniques mainly rely on single-dimensional feature models,
potentially neglecting the abundance of information hidden in various speech
characteristics. To rectify this, we present the novel Attention-Based Acoustic
Feature Fusion Network (ABAFnet) for depression detection. ABAFnet combines
four different acoustic features into a comprehensive deep learning model,
thereby effectively integrating and blending multi-tiered features. We present
a novel weight adjustment module for late fusion that boosts performance by
efficaciously synthesizing these features. The effectiveness of our approach is
confirmed via extensive validation on two clinical speech databases, CNRAC and
CS-NRAC, thereby outperforming previous methods in depression detection and
subtype classification. Further in-depth analysis confirms the key role of each
feature and highlights the importance of MFCCrelated features in speech-based
depression detection.
- Abstract(参考訳): 一般的な精神障害であるうつ病は、個人に大きな影響を与え、社会的な影響を与える。
障害の複雑さと多様性は、迅速かつ効果的な検出を必要とするが、それでも難しい課題となる。
この状況は、検出方法の改善に対する緊急の要求を強調している。
高度な機械学習パラダイムによる聴覚データの利用は、有望な研究の方向性を示す。
しかし、既存の技術は主に1次元の特徴モデルに依存しており、様々な音声特性に隠された情報の多さを無視する可能性がある。
そこで本研究では,抑うつ検出のための注意型音響特徴融合ネットワーク(abafnet)を提案する。
ABAFnetは、4つの異なる音響特徴を包括的ディープラーニングモデルに組み合わせ、多層的特徴を効果的に統合しブレンドする。
本稿では,これらの特徴を効果的に合成することにより,性能を向上させるための新しい重量調整モジュールを提案する。
提案手法の有効性は,CNRACとCS-NRACの2つの臨床音声データベースに対する広範な検証により確認され,うつ病検出法やサブタイプ分類法よりも優れていた。
さらに詳細な分析により、各特徴の重要な役割が確認され、音声による抑うつ検出におけるMFCC関連の特徴の重要性が強調される。
関連論文リスト
- Towards Within-Class Variation in Alzheimer's Disease Detection from Spontaneous Speech [60.08015780474457]
アルツハイマー病(AD)の検出は、機械学習の分類モデルを使用する有望な研究領域として浮上している。
我々は、AD検出において、クラス内変異が重要な課題であると考え、ADを持つ個人は認知障害のスペクトルを示す。
本稿では,ソフトターゲット蒸留 (SoTD) とインスタンスレベルの再分散 (InRe) の2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T02:06:05Z) - Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - Density Adaptive Attention-based Speech Network: Enhancing Feature Understanding for Mental Health Disorders [0.8437187555622164]
DAAMAudioCNNLSTMとDAAMAudioTransformerを導入する。
両モデルとも、抑うつ検出に音声信号を利用する際の重要な説明可能性と効率は、より信頼性が高く、臨床的に有用な診断ツールへの飛躍を表している。
論文 参考訳(メタデータ) (2024-08-31T08:50:28Z) - A Depression Detection Method Based on Multi-Modal Feature Fusion Using Cross-Attention [3.4872769952628926]
世界の人口の約3.8%が落ち込んでいる。
低所得国と中所得国の75%以上が未治療のままである。
本稿では,クロスアテンションを用いたマルチモーダル特徴融合に基づく抑うつ検出手法を提案する。
論文 参考訳(メタデータ) (2024-07-02T13:13:35Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - What to Remember: Self-Adaptive Continual Learning for Audio Deepfake
Detection [53.063161380423715]
既存の検出モデルは、既知のディープフェイク音声を識別することに成功したが、新しい攻撃タイプに遭遇する際には苦労している。
本稿では,Radian Weight Modification (RWM) と呼ばれる連続的な学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-15T09:52:17Z) - DEPAC: a Corpus for Depression and Anxiety Detection from Speech [3.2154432166999465]
本稿では、うつ病と不安スクリーニングツールの確立したしきい値に基づいてラベル付けされた、心的苦痛分析オーディオデータセットDEPACを紹介する。
この大きなデータセットは、個人ごとの複数の音声タスクと、関連する人口統計情報から構成される。
人間の音声における精神疾患の徴候の同定に有効な,手作業による音響的特徴と言語的特徴からなる特徴セットを提案する。
論文 参考訳(メタデータ) (2023-06-20T12:21:06Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Automatic Depression Detection via Learning and Fusing Features from
Visual Cues [42.71590961896457]
本稿では,視覚的手がかりから特徴を学習し,融合させることにより,新しい自動抑うつ検出法を提案する。
本手法は,DAIC_WOZデータセット上での最先端性能を,他の視覚的特徴に基づく手法と比較して達成する。
論文 参考訳(メタデータ) (2022-03-01T09:28:12Z) - Multimodal Depression Severity Prediction from medical bio-markers using
Machine Learning Tools and Technologies [0.0]
うつ病は世界中の精神疾患の主要な原因となっている。
近年,うつ病の診断とステージ予測の自動化に行動的手がかりが用いられている。
ラベル付き行動データセットの欠如と、膨大な量のバリエーションが、タスクを達成する上で大きな課題であることが証明されている。
論文 参考訳(メタデータ) (2020-09-11T20:44:28Z) - Audio Impairment Recognition Using a Correlation-Based Feature
Representation [85.08880949780894]
本稿では,特徴対の相関に基づく手作り特徴の新しい表現を提案する。
実験段階において,コンパクトな特徴次元と計算速度の向上の観点から,優れた性能を示す。
論文 参考訳(メタデータ) (2020-03-22T13:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。