論文の概要: Robust and Explainable Depression Identification from Speech Using Vowel-Based Ensemble Learning Approaches
- arxiv url: http://arxiv.org/abs/2410.18298v1
- Date: Wed, 23 Oct 2024 22:03:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 12:50:44.897076
- Title: Robust and Explainable Depression Identification from Speech Using Vowel-Based Ensemble Learning Approaches
- Title(参考訳): 母音に基づくアンサンブル学習アプローチを用いた音声からのロバストおよび説明可能な抑うつ識別
- Authors: Kexin Feng, Theodora Chaspari,
- Abstract要約: 本研究では、音声から抑うつを識別するための説明可能な機械学習アルゴリズムについて検討する。
個別の患者健康アンケート8(PHQ-8)項目スコアを予測する8つのモデルを備えたボットアップアプローチと、うつ病を評価するルータモジュールを備えたMixture of Experts(MoE)を用いた"トップダウン"アプローチである。
どちらの手法も最先端のベースラインに匹敵するパフォーマンスを描いており、平均/中間値のデータセットに対する重大さと感受性の低下を示している。
- 参考スコア(独自算出の注目度): 5.102770724328495
- License:
- Abstract: This study investigates explainable machine learning algorithms for identifying depression from speech. Grounded in evidence from speech production that depression affects motor control and vowel generation, pre-trained vowel-based embeddings, that integrate semantically meaningful linguistic units, are used. Following that, an ensemble learning approach decomposes the problem into constituent parts characterized by specific depression symptoms and severity levels. Two methods are explored: a "bottom-up" approach with 8 models predicting individual Patient Health Questionnaire-8 (PHQ-8) item scores, and a "top-down" approach using a Mixture of Experts (MoE) with a router module for assessing depression severity. Both methods depict performance comparable to state-of-the-art baselines, demonstrating robustness and reduced susceptibility to dataset mean/median values. System explainability benefits are discussed highlighting their potential to assist clinicians in depression diagnosis and screening.
- Abstract(参考訳): 本研究では、音声から抑うつを識別するための説明可能な機械学習アルゴリズムについて検討する。
抑うつが運動制御と母音生成に影響を与えるという音声生成の証拠に基づいて、意味論的に意味のある言語単位を統合する事前訓練された母音ベースの埋め込みが使用される。
その後、アンサンブル学習アプローチでは、特定のうつ症状と重症度を特徴とする構成部品に問題を分解する。
個別の患者健康アンケート8(PHQ-8)項目スコアを予測する8つのモデルを備えたボットアップアプローチと、うつ病重症度を評価するルータモジュールを備えたMixture of Experts(MoE)を用いた"トップダウン"アプローチである。
どちらの手法も、最先端のベースラインに匹敵するパフォーマンスを示し、ロバスト性を示し、平均/中間値のデータセットへの感受性を低下させる。
うつ病の診断とスクリーニングにおいて臨床医を支援する可能性を強調し,システム説明可能性の利点について考察した。
関連論文リスト
- Language-Agnostic Analysis of Speech Depression Detection [2.5764071253486636]
本研究は、英語とマラヤラムの2言語間での自動抑うつ検出を解析する。
CNNモデルは、両言語に焦点をあてて、抑うつに関連する音響的特徴を特定するために訓練される。
その結果,言語に依存しない抑うつ検出システムの開発に寄与する可能性が示唆された。
論文 参考訳(メタデータ) (2024-09-23T07:35:56Z) - LLM Questionnaire Completion for Automatic Psychiatric Assessment [49.1574468325115]
大規模言語モデル(LLM)を用いて、非構造的心理面接を、様々な精神科領域と人格領域にまたがる構造化された質問票に変換する。
得られた回答は、うつ病の標準化された精神医学的指標(PHQ-8)とPTSD(PCL-C)の予測に使用される特徴として符号化される。
論文 参考訳(メタデータ) (2024-06-09T09:03:11Z) - Evaluating Lexicon Incorporation for Depression Symptom Estimation [2.149662952755067]
本稿では、抑うつ症状推定のためのトランスフォーマーモデルに感情、感情、およびドメイン固有の語彙を組み込むことによる影響について検討する。
その結果,事前学習言語モデルにおける外部知識の導入は,予測性能に有益であることが示唆された。
患者とセラピストの面接による抑うつレベルの推定について, 最新の研究結果を得た。
論文 参考訳(メタデータ) (2024-04-30T08:41:06Z) - Hierarchical attention interpretation: an interpretable speech-level
transformer for bi-modal depression detection [6.561362931802501]
うつ病は一般的な精神疾患である。機械学習によって実現された音声を用いた自動うつ病検出ツールは、うつ病の早期スクリーニングに役立つ。
本稿では、セグメントレベルのラベリングによるノイズと、モデル解釈可能性の欠如という、そのようなツールの臨床的実装を妨げる可能性のある2つの制限に対処する。
論文 参考訳(メタデータ) (2023-09-23T20:48:58Z) - DepreSym: A Depression Symptom Annotated Corpus and the Role of LLMs as
Assessors of Psychological Markers [3.5511184956329727]
DepreSym データセットは Beck Depression Inventory-II 症状に関連する21580 文からなる。
このデータセットは、臨床症状などのうつ病マーカーを組み込んだモデルの開発を進めるための貴重なリソースとなる。
論文 参考訳(メタデータ) (2023-08-21T14:44:31Z) - The Relationship Between Speech Features Changes When You Get Depressed:
Feature Correlations for Improving Speed and Performance of Depression
Detection [69.88072583383085]
この研究は、抑うつが音声から抽出した特徴間の相関を変化させることを示す。
このような洞察を用いることで、SVMとLSTMに基づく抑うつ検出器のトレーニング速度と性能を向上させることができる。
論文 参考訳(メタデータ) (2023-07-06T09:54:35Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Bayesian Networks for the robust and unbiased prediction of depression
and its symptoms utilizing speech and multimodal data [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z) - Multimodal Depression Severity Prediction from medical bio-markers using
Machine Learning Tools and Technologies [0.0]
うつ病は世界中の精神疾患の主要な原因となっている。
近年,うつ病の診断とステージ予測の自動化に行動的手がかりが用いられている。
ラベル付き行動データセットの欠如と、膨大な量のバリエーションが、タスクを達成する上で大きな課題であることが証明されている。
論文 参考訳(メタデータ) (2020-09-11T20:44:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。