論文の概要: IDRL: An Individual-Aware Multimodal Depression-Related Representation Learning Framework for Depression Diagnosis
- arxiv url: http://arxiv.org/abs/2603.11644v1
- Date: Thu, 12 Mar 2026 08:12:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.956499
- Title: IDRL: An Individual-Aware Multimodal Depression-Related Representation Learning Framework for Depression Diagnosis
- Title(参考訳): IDRL:自己認識型マルチモーダル抑うつ関連表現学習フレームワーク
- Authors: Chongxiao Wang, Junjie Liang, Peng Cao, Jinzhu Yang, Osmar R. Zaiane,
- Abstract要約: マルチモーダルうつ病検出は,複数のモーダルからの相補的情報を共同でモデル化することで診断性能を向上させることを目的としている。
これらの手法は、モーダル間不整合とうつ病と無関係な干渉の2つの制限に悩まされる。
我々は,頑健なうつ病診断のためのIDRL(Personal-Aware Multimodal Depression-related Representation Learning Framework)を提案する。
- 参考スコア(独自算出の注目度): 10.592616567581144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depression is a severe mental disorder, and reliable identification plays a critical role in early intervention and treatment. Multimodal depression detection aims to improve diagnostic performance by jointly modeling complementary information from multiple modalities. Recently, numerous multimodal learning approaches have been proposed for depression analysis; however, these methods suffer from the following limitations: 1) inter-modal inconsistency and depression-unrelated interference, where depression-related cues may conflict across modalities while substantial irrelevant content obscures critical depressive signals, and 2) diverse individual depressive presentations, leading to individual differences in modality and cue importance that hinder reliable fusion. To address these issues, we propose Individual-aware Multimodal Depression-related Representation Learning Framework (IDRL) for robust depression diagnosis. Specifically, IDRL 1) disentangles multimodal representations into a modality-common depression space, a modality-specific depression space, and a depression-unrelated space to enhance modality alignment while suppressing irrelevant information, and 2) introduces an individual-aware modality-fusion module (IAF) that dynamically adjusts the weights of disentangled depression-related features based on their predictive significance, thereby achieving adaptive cross-modal fusion for different individuals. Extensive experiments demonstrate that IDRL achieves superior and robust performance for multimodal depression detection.
- Abstract(参考訳): うつ病は重篤な精神疾患であり、早期の介入や治療において信頼性の高い識別が重要な役割を果たす。
マルチモーダルうつ病検出は,複数のモーダルからの相補的情報を共同でモデル化することで診断性能を向上させることを目的としている。
近年、抑うつ分析に多くのマルチモーダル学習手法が提案されているが、これらの手法には以下の制限がある。
1)モーダル間不整合とうつ関係の干渉、うつ関係の手がかりがモダリティ間で対立することがあるが、実質的無関係な内容は重要な抑うつシグナルを曖昧にし、
2) 個別の抑うつ的プレゼンテーションは多様であり, 信頼性の高い融合を妨げるモダリティとキューの重要性の個人差に繋がった。
これらの課題に対処するため、我々は、頑健なうつ病診断のためのIDRL(Personal-Aware Multimodal Depression-related Representation Learning Framework)を提案する。
特にIDRL
1)マルチモーダル表現をモダリティに共通な抑うつ空間、モダリティに特有な抑うつ空間、および不適切な情報を抑えつつモダリティアライメントを高めるために不適切な非関連空間に分散させる。
2) 個別認識型モダリティ融合モジュール (IAF) を導入し, 抑うつ関連特徴の重み付けを予測的意義に基づいて動的に調整し, 異なる個人に対して適応的相互拡散を実現する。
大規模実験により, IDRLはマルチモーダル抑うつ検出において, 優れた, 堅牢な性能を発揮することが示された。
関連論文リスト
- DepFlow: Disentangled Speech Generation to Mitigate Semantic Bias in Depression Detection [54.209716321122194]
抑うつ条件付きテキスト音声合成フレームワークであるDepFlowについて述べる。
抑うつ音響カモフラージュは、対向訓練を通じて話者と内容不変の抑うつ埋め込みを学習する。
フローマッチングTTSモデルとFiLM変調はこれらの埋め込みを合成に注入し、うつ病の重症度を制御する。
プロトタイプベースの重度マッピング機構は、うつ病連続体を滑らかかつ解釈可能な操作を提供する。
論文 参考訳(メタデータ) (2026-01-01T10:44:38Z) - Towards Stable Cross-Domain Depression Recognition under Missing Modalities [46.292478012586066]
うつ病は自殺を含む深刻な公衆衛生上のリスクを生じさせ、タイムリーでスケーラブルなスクリーニングの緊急性を強調している。
マルチモーダル大言語モデル(SCD-MLLM)に基づく安定なドメイン間圧縮認識のための統合フレームワークを提案する。
このフレームワークは、様々なソースから収集された不均一なうつ病関連データの統合と処理をサポートする。
論文 参考訳(メタデータ) (2025-12-06T14:19:57Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis [58.67342568632529]
MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。
MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文 参考訳(メタデータ) (2025-06-04T09:18:25Z) - Speech as a Multimodal Digital Phenotype for Multi-Task LLM-based Mental Health Prediction [0.4517077427559345]
うつ病検出のための3モーダルマルチメディアデータソースとして,患者音声データの処理を提案する。
提案手法は,抑うつ早期警戒データセットを用いて,3モーダル長手MLLを特徴とする手法である。
バランスの取れた精度は70.8%で、これは一方向、単一タスク、および非縦方向のそれぞれの方法よりも高い。
論文 参考訳(メタデータ) (2025-05-28T04:07:17Z) - A Depression Detection Method Based on Multi-Modal Feature Fusion Using Cross-Attention [3.4872769952628926]
世界の人口の約3.8%が落ち込んでいる。
低所得国と中所得国の75%以上が未治療のままである。
本稿では,クロスアテンションを用いたマルチモーダル特徴融合に基づく抑うつ検出手法を提案する。
論文 参考訳(メタデータ) (2024-07-02T13:13:35Z) - Depression Diagnosis and Analysis via Multimodal Multi-order Factor
Fusion [4.991507302519828]
うつ病は世界中で主要な死因であり、うつ病の診断は簡単ではない。
うつ病の自動診断のためのMMFF法を提案する。
論文 参考訳(メタデータ) (2022-12-31T17:13:06Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z) - Multimodal Depression Severity Prediction from medical bio-markers using
Machine Learning Tools and Technologies [0.0]
うつ病は世界中の精神疾患の主要な原因となっている。
近年,うつ病の診断とステージ予測の自動化に行動的手がかりが用いられている。
ラベル付き行動データセットの欠如と、膨大な量のバリエーションが、タスクを達成する上で大きな課題であることが証明されている。
論文 参考訳(メタデータ) (2020-09-11T20:44:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。