論文の概要: Towards Explainable Multimodal Depression Recognition for Clinical Interviews
- arxiv url: http://arxiv.org/abs/2501.16106v1
- Date: Mon, 27 Jan 2025 14:57:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:57:08.139476
- Title: Towards Explainable Multimodal Depression Recognition for Clinical Interviews
- Title(参考訳): 臨床面接における説明可能なマルチモーダル抑うつ認識に向けて
- Authors: Wenjie Zheng, Qiming Xie, Zengzhi Wang, Jianfei Yu, Rui Xia,
- Abstract要約: 臨床面接のための説明可能なマルチモーダル抑うつ認識(EMDRC)タスクを提案する。
EMDRCの目的は,8項目の患者健康アンケートうつ病尺度(PHQ-8)に基づいて参加者の症状を要約し,重症度を予測することである。
我々はPHQ-8を利用して、発話レベルの症状関連意味情報をキャプチャして対話レベルの要約を生成するPHQ対応マルチモーダルマルチタスク学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 35.44160851001628
- License:
- Abstract: Recently, multimodal depression recognition for clinical interviews (MDRC) has recently attracted considerable attention. Existing MDRC studies mainly focus on improving task performance and have achieved significant development. However, for clinical applications, model transparency is critical, and previous works ignore the interpretability of decision-making processes. To address this issue, we propose an Explainable Multimodal Depression Recognition for Clinical Interviews (EMDRC) task, which aims to provide evidence for depression recognition by summarizing symptoms and uncovering underlying causes. Given an interviewer-participant interaction scenario, the goal of EMDRC is to structured summarize participant's symptoms based on the eight-item Patient Health Questionnaire depression scale (PHQ-8), and predict their depression severity. To tackle the EMDRC task, we construct a new dataset based on an existing MDRC dataset. Moreover, we utilize the PHQ-8 and propose a PHQ-aware multimodal multi-task learning framework, which captures the utterance-level symptom-related semantic information to help generate dialogue-level summary. Experiment results on our annotated dataset demonstrate the superiority of our proposed methods over baseline systems on the EMDRC task.
- Abstract(参考訳): 近年,MDRC (Multimodal depression recognition for Clinical interviews) が注目されている。
既存のMDRC研究は主にタスクパフォーマンスの改善に重点を置いており、大きな発展を遂げている。
しかし、臨床応用においては、モデルの透明性が重要であり、以前の研究は意思決定プロセスの解釈可能性を無視していた。
本稿では,症状を要約し,根本原因を明らかにすることでうつ病認識の証拠を提供することを目的として,EMDRC(Explainable Multimodal Depression Recognition for Clinical Interviews)タスクを提案する。
インタビュアーと参加者の対話シナリオを考えると,EMDRCの目標は,8項目の患者健康アンケートうつ病尺度(PHQ-8)に基づいて参加者の症状を要約し,うつ病の重症度を予測することである。
EMDRC タスクに対処するため,既存の MDRC データセットに基づく新しいデータセットを構築した。
さらに、PHQ-8を用いて、発話レベルの症状関連意味情報をキャプチャして対話レベルの要約を生成するPHQ対応マルチモーダルマルチタスク学習フレームワークを提案する。
EMDRCタスクのベースラインシステムよりも提案手法の方が優れていることを示す。
関連論文リスト
- Innovative Framework for Early Estimation of Mental Disorder Scores to Enable Timely Interventions [0.9297614330263184]
本稿では,PTSDとうつ病の自動分類のための高度なマルチモーダル深層学習システムについて述べる。
提案手法は, うつ病では92%, PTSDでは93%の分類精度を達成し, 従来の単潮流法よりも優れていた。
論文 参考訳(メタデータ) (2025-02-06T10:57:10Z) - MADP: Multi-Agent Deductive Planning for Enhanced Cognitive-Behavioral Mental Health Question Answer [7.738135970011351]
マルチエージェント・デダクティブ・プランニング(MADP)というフレームワークを提案する。
MADPは認知行動療法(CBT)の様々な心理的要素間の相互作用に基づいている
我々はMADPフレームワークに基づいた新しいデータセットを構築し、それをLLM(Large Language Models)の微調整に利用する。
論文 参考訳(メタデータ) (2025-01-27T07:18:47Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking [58.25862290294702]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - Robust and Explainable Depression Identification from Speech Using Vowel-Based Ensemble Learning Approaches [5.102770724328495]
本研究では、音声から抑うつを識別するための説明可能な機械学習アルゴリズムについて検討する。
個別の患者健康アンケート8(PHQ-8)項目スコアを予測する8つのモデルを備えたボットアップアプローチと、うつ病を評価するルータモジュールを備えたMixture of Experts(MoE)を用いた"トップダウン"アプローチである。
どちらの手法も最先端のベースラインに匹敵するパフォーマンスを描いており、平均/中間値のデータセットに対する重大さと感受性の低下を示している。
論文 参考訳(メタデータ) (2024-10-23T22:03:09Z) - CBT-Bench: Evaluating Large Language Models on Assisting Cognitive Behavior Therapy [67.23830698947637]
認知行動療法(CBT)支援の体系的評価のための新しいベンチマークであるCBT-BENCHを提案する。
我々は, CBT-BENCHにおける3段階の課題を含む: I: 基本的CBT知識獲得, 複数選択質問のタスク; II: 認知的モデル理解, 認知的歪み分類, 主根的信念分類, きめ細かい中核信念分類のタスク; III: 治療的応答生成, CBTセラピーセッションにおける患者音声に対する応答生成のタスク。
実験結果から,LLMはCBT知識のリサイティングに優れるが,複雑な実世界のシナリオでは不十分であることが示唆された。
論文 参考訳(メタデータ) (2024-10-17T04:52:57Z) - HiQuE: Hierarchical Question Embedding Network for Multimodal Depression Detection [11.984035389013426]
HiQuEは、臨床面接における一次質問とフォローアップ質問の階層的関係を活用する、新規なうつ病検出フレームワークである。
我々はDAIC-WOZという,広く利用されている臨床面接データについて広範な実験を行い,そのモデルが他の最先端マルチモーダルうつ病検出モデルより優れていることを示した。
論文 参考訳(メタデータ) (2024-08-07T09:23:01Z) - LLM Questionnaire Completion for Automatic Psychiatric Assessment [49.1574468325115]
大規模言語モデル(LLM)を用いて、非構造的心理面接を、様々な精神科領域と人格領域にまたがる構造化された質問票に変換する。
得られた回答は、うつ病の標準化された精神医学的指標(PHQ-8)とPTSD(PCL-C)の予測に使用される特徴として符号化される。
論文 参考訳(メタデータ) (2024-06-09T09:03:11Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。