Fugu-MT 論文翻訳(概要): Detecting the Severity of Major Depressive Disorder from Speech: A Novel HARD-Training Methodology

論文の概要: Detecting the Severity of Major Depressive Disorder from Speech: A Novel HARD-Training Methodology

arxiv url: http://arxiv.org/abs/2206.01542v1
Date: Thu, 2 Jun 2022 13:26:03 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-07 08:48:59.615245
Title: Detecting the Severity of Major Depressive Disorder from Speech: A Novel HARD-Training Methodology
Title（参考訳）: 音声から大うつ病の重症度を検出する:新しいハード・トレーニング法
Authors: Edward L. Campbell, Judith Dineley, Pauline Conde, Faith Matcham, Femke Lamers, Sara Siddi, Laura Docio-Fernandez, Carmen Garcia-Mateo, Nicholas Cummins and the RADAR-CNS Consortium
Abstract要約: メジャー・うつ病(Major Depressive Disorder、MDD)は、社会経済的コストの高い世界的メンタルヘルス問題である。したがって、MDDの予測と自動検出は社会に大きな影響を与える可能性がある。 RADAR-MDDは、音声やその他のデジタルバイオマーカーを収集する観察コホート研究である。
参考スコア（独自算出の注目度）: 8.832823703632073
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Major Depressive Disorder (MDD) is a common worldwide mental health issue with high associated socioeconomic costs. The prediction and automatic detection of MDD can, therefore, make a huge impact on society. Speech, as a non-invasive, easy to collect signal, is a promising marker to aid the diagnosis and assessment of MDD. In this regard, speech samples were collected as part of the Remote Assessment of Disease and Relapse in Major Depressive Disorder (RADAR-MDD) research programme. RADAR-MDD was an observational cohort study in which speech and other digital biomarkers were collected from a cohort of individuals with a history of MDD in Spain, United Kingdom and the Netherlands. In this paper, the RADAR-MDD speech corpus was taken as an experimental framework to test the efficacy of a Sequence-to-Sequence model with a local attention mechanism in a two-class depression severity classification paradigm. Additionally, a novel training method, HARD-Training, is proposed. It is a methodology based on the selection of more ambiguous samples for the model training, and inspired by the curriculum learning paradigm. HARD-Training was found to consistently improve - with an average increment of 8.6% - the performance of our classifiers for both of two speech elicitation tasks used and each collection site of the RADAR-MDD speech corpus. With this novel methodology, our Sequence-to-Sequence model was able to effectively detect MDD severity regardless of language. Finally, recognising the need for greater awareness of potential algorithmic bias, we conduct an additional analysis of our results separately for each gender.
Abstract（参考訳）: メジャー・うつ病(Major Depressive Disorder、MDD)は、社会経済的コストの高い世界的メンタルヘルス問題である。したがって、MDDの予測と自動検出は社会に大きな影響を与える可能性がある。非侵襲的で信号の収集が容易な音声は、MDDの診断と評価に役立つ有望なマーカーである。この観点からは,大うつ病(radar-mdd)研究プログラムにおける遠隔診断の一環として,音声サンプルを収集した。 RADAR-MDDは、スペイン、イギリス、オランダにおけるMDDの歴史を持つ個人のコホートから、スピーチやその他のデジタルバイオマーカーを収集する観察的コホート研究である。本稿では, RAAR-MDD音声コーパスを, 局所的な注意機構を持つシーケンス・ツー・シーケンスモデルの有効性を, 2階層の抑うつ重度分類パラダイムで検証するための実験的枠組みとして用いた。また,新しいトレーニング手法であるHARD-Trainingを提案する。モデル学習のためのより曖昧なサンプルの選択に基づく方法論であり、カリキュラム学習パラダイムに触発されたものである。 HARD-Training は平均 8.6% の増分で連続的に改善し,使用する2つの音声誘発タスクと RADAR-MDD 音声コーパスの各収集部位の分類器の性能が向上した。本手法では, 言語によらずMDDの重大度を効果的に検出することができた。最後に,潜在的なアルゴリズムバイアスに対する意識を高める必要性を認識し,性別別に結果のさらなる分析を行う。

関連論文リスト

Linguistic and Audio Embedding-Based Machine Learning for Alzheimer's Dementia and Mild Cognitive Impairment Detection: Insights from the PROCESS Challenge [0.0]
音声は、音響的次元と言語的次元の両方を包含し、認知の低下に対して有望な非侵襲的バイオマーカーを提供する。本稿では,自然発声音声からの音声埋め込みと言語的特徴を両立させるプロシージャチャレンジのための機械学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-10-02T06:54:55Z)
Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder [60.84344168388442]
言語関連機能的磁気共鳴画像(fMRI)は,認知機能低下と早期NCDの検出に有望なアプローチである。香港在住の高齢者97名を対象に,この課題の有効性について検討した。本研究は、加齢に伴う認知低下とNCDの早期発見のための自然言語関連fMRIタスクの可能性を示した。
論文参考訳（メタデータ） (2025-06-10T16:58:47Z)
LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文参考訳（メタデータ） (2025-01-07T08:49:04Z)
Towards Within-Class Variation in Alzheimer's Disease Detection from Spontaneous Speech [60.08015780474457]
アルツハイマー病(AD)の検出は、機械学習の分類モデルを使用する有望な研究領域として浮上している。我々は、AD検出において、クラス内変異が重要な課題であると考え、ADを持つ個人は認知障害のスペクトルを示す。本稿では,ソフトターゲット蒸留 (SoTD) とインスタンスレベルの再分散 (InRe) の2つの新しい手法を提案する。
論文参考訳（メタデータ） (2024-09-22T02:06:05Z)
DenseNet and Support Vector Machine classifications of major depressive disorder using vertex-wise cortical features [2.29023553248714]
大うつ病 (Major depressive disorder, MDD) は、世界中の数億の個人に影響を及ぼす複雑な精神疾患である。ディープラーニングツールのニューロイメージングデータへの応用は、MDDの診断および予測バイオマーカーを提供する可能性がある。 MDD患者と健康管理 (HC) を線形機械学習による分節的大脳皮質の特徴に基づいて解離させる試みは, 精度が低いことが報告されている。
論文参考訳（メタデータ） (2023-11-18T11:46:25Z)
Phonological Level wav2vec2-based Mispronunciation Detection and Diagnosis Method [11.069975459609829]
音声特徴量検出に基づく低レベルの誤認識検出と診断(MDD)手法を提案する。提案手法は,母国語からの英語学習者から収集したL2音声コーパスに適用した。
論文参考訳（メタデータ） (2023-11-13T02:41:41Z)
Leveraging Pretrained Representations with Task-related Keywords for Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文参考訳（メタデータ） (2023-03-14T16:03:28Z)
Cross-lingual Alzheimer's Disease detection based on paralinguistic and pre-trained features [6.928826160866143]
本稿ではICASSP-SPGC-2023 ADReSS-M Challenge Taskについて述べる。この課題は、アルツハイマー病の予測のために、どの音響特徴を一般化し、言語間で伝達できるかを検討することである。我々は、openSmileツールキットとXLSR-53を用いた音響特性を用いてパラ言語的特徴を抽出する。本手法は分類タスクの69.6%の精度と回帰タスクの4.788の根平均二乗誤差(RMSE)を実現する。
論文参考訳（メタデータ） (2023-03-14T06:34:18Z)
Patched Diffusion Models for Unsupervised Anomaly Detection in Brain MRI [55.78588835407174]
本稿では,正常脳解剖のパッチベース推定法として拡散モデルの生成タスクを再構築する手法を提案する。腫瘍と多発性硬化症について検討し,既存のベースラインと比較して25.1%の改善がみられた。
論文参考訳（メタデータ） (2023-03-07T09:40:22Z)
Semantic Coherence Markers for the Early Diagnosis of the Alzheimer Disease [0.0]
パープレキシティはもともと、与えられた言語モデルがテキストシーケンスを予測するのにどの程度適しているかを評価するための情報理論の尺度として考え出された。我々は2グラムから5グラムまでのN-gramとトランスフォーマーベース言語モデルであるGPT-2を多種多様な言語モデルに適用した。ベストパフォーマンスモデルでは、ADクラスと制御対象の両方から対象を分類する際に、完全精度とFスコア(精度/特異度とリコール/感度のそれぞれ1.00)を達成した。
論文参考訳（メタデータ） (2023-02-02T11:40:16Z)
Ontology-aware Learning and Evaluation for Audio Tagging [56.59107110017436]
平均平均精度(mAP)は、異なる種類の音をそれらの関係を考慮せずに独立したクラスとして扱う。オントロジー認識平均平均精度(OmAP)は、評価中にAudioSetオントロジー情報を利用することで、mAPの弱点に対処する。我々は人間の評価を行い、OmAPはmAPよりも人間の知覚と一致していることを示した。
論文参考訳（メタデータ） (2022-11-22T11:35:14Z)
Multi-modal fusion with gating using audio, lexical and disfluency features for Alzheimer's Dementia recognition from spontaneous speech [11.34426502082293]
本論文は、自発音声(ADReSS)によるアルツハイマー認知症への挑戦である。本研究の目的は、音声データからアルツハイマー病の重症度の自動予測を支援する方法を開発することである。
論文参考訳（メタデータ） (2021-06-17T17:20:57Z)
NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文参考訳（メタデータ） (2021-02-10T13:00:29Z)
Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。 PD症状には、震動、剛性、ブレイキネジアがある。本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文参考訳（メタデータ） (2020-05-06T09:02:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。