論文の概要: Dep-LLM: Training-Free Depression Diagnosis via Evidence-Guided Structured Multi-factor with Reliable LLM Reasoning
- arxiv url: http://arxiv.org/abs/2606.10796v1
- Date: Tue, 09 Jun 2026 12:44:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.498413
- Title: Dep-LLM: Training-Free Depression Diagnosis via Evidence-Guided Structured Multi-factor with Reliable LLM Reasoning
- Title(参考訳): Dep-LLM: 信頼性LLM推論を用いたEvidence-Guided Structured Multi-factorによる学習自由な抑うつ診断
- Authors: Yiqing Lyu, Xianbing Zhao, Buzhou Tang, Ronghuan Jiang,
- Abstract要約: Dep-LLMは、臨床精神科医の段階的な推論を反映した、トレーニングなしのフレームワークである。
フリーズ・ザ・シェルフ・ファウンデーション LLM で運用されている。
精度、マクロF1、重み付き平均F1といった9つの指標で、21の基盤LDMのほぼすべてでゼロショットベースラインを超えている。
- 参考スコア(独自算出の注目度): 12.568172258915801
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic Depression Detection (ADD) from clinical interviews is a pivotal task in computational mental health, yet it remains challenging due to two critical obstacles: 1) difficulty in modeling complex but sparsely distributed depression clues within lengthy, multi-topic clinical interviews, leading to superficial and unreliable reasoning; 2) scarcity of labeled data due to clinical privacy, together with high cost of training and fine-tuning, limiting the deployment of supervised ADD systems. To jointly address these challenges, we propose Dep-LLM, a training-free framework that mirrors the step-by-step reasoning of clinical psychiatrists and operates entirely on frozen off-the-shelf foundation LLMs. Dep-LLM comprises three stages. First, a Chain-of-Thought (CoT) Depression Multi-factor Analysis module structurally decomposes the long dialogue into five clinically aligned themes and produces evidence-grounded rationales, effectively handling long-context dependencies. Second, we introduce Confidence Analysis and Modulation module that quantifies the epistemic reliability from token-level entropy of each rationale and applies an intra-label and inter-theme modulation that amplifies trustworthy signals while suppressing uncertain ones without extra training. Third, a Collaborative Multi-factor Prediction module dynamically integrates multi-factor signals weighted by confidence into the final diagnosis. Extensive experiments on the DAIC-WOZ and E-DAIC datasets demonstrate the effectiveness and generalizability of Dep-LLM: it surpasses zero-shot baseline on nearly all 21 foundation LLMs across 9 metrics such as accuracy, macro F1 and weighted-average F1, and further outperforms state-of-the-art supervised domain-specific LLMs as well as the latest closed-source commercial LLMs, while requiring no extra training.
- Abstract(参考訳): 臨床面接からの自動抑うつ検出(ADD)は、計算的メンタルヘルスにおいて重要な課題であるが、2つの重要な障害があるため、依然として困難である。
1) 複雑だが軽度に分散したうつ病の手がかりを多面的臨床面接でモデル化することの難しさは,表面的かつ信頼性の低い推論に繋がる。
2) 臨床プライバシによるラベル付きデータの不足, トレーニングや微調整のコストが高いこと, 管理型ADDシステムの展開を制限している。
これらの課題に共同で対処するために,臨床精神科医のステップバイステップ推論を反映したトレーニングフリーのフレームワークであるDep-LLMを提案する。
Dep-LLMは3つのステージからなる。
まず,CoT (Chain-of-Thought) Depression Multi-factor Analysisモジュールによって,長文の対話を5つの臨床テーマに分解し,エビデンスを根拠とした合理性を生成し,長文の依存関係を効果的に処理する。
第2に,各理論のトークンレベルエントロピーからエピステミック信頼性を定量化する信頼度解析・変調モジュールを導入し,信頼に値する信号を増幅するラベル内およびテーマ間変調を適用し,不確実な信号を余分な訓練なしで抑制する。
第3に、協調的多要素予測モジュールは、信頼度で重み付けられた多要素信号を最終診断に動的に統合する。
DAIC-WOZとE-DAICデータセットの大規模な実験は、Dep-LLMの有効性と一般化性を実証している。これは、精度、マクロF1、重み付き平均F1といった9つの指標にわたる21の基盤LLMのほぼすべてのゼロショットベースラインを超え、さらに最先端の教師付きドメイン固有LLMや最新のクローズドソース商用LLMよりも優れており、追加のトレーニングは不要である。
関連論文リスト
- A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。
本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文 参考訳(メタデータ) (2026-01-16T02:32:07Z) - OncoReason: Structuring Clinical Reasoning in LLMs for Robust and Interpretable Survival Prediction [2.904892426557913]
大規模言語モデル (LLM) は, バイオメディカルNLPにおいて高い性能を示した。
本稿では,自己回帰型LPMと結果予測のための臨床推論を整合させる,統合型マルチタスク学習フレームワークを提案する。
マルチタスク・クリニカル・モデリングにおける推論・アライメントの重要性について検討した。
論文 参考訳(メタデータ) (2025-10-20T13:35:12Z) - Hierarchical Self-Supervised Representation Learning for Depression Detection from Speech [51.14752758616364]
音声による抑うつ検出 (SDD) は、従来の臨床評価に代わる有望で非侵襲的な代替手段である。
HAREN-CTCは,マルチタスク学習フレームワーク内でのクロスアテンションを用いて,多層SSL機能を統合した新しいアーキテクチャである。
このモデルはDAIC-WOZで0.81、MODMAで0.82の最先端マクロF1スコアを達成し、両方の評価シナリオで先行手法より優れている。
論文 参考訳(メタデータ) (2025-10-05T09:32:12Z) - Trustworthy AI Psychotherapy: Multi-Agent LLM Workflow for Counseling and Explainable Mental Disorder Diagnosis [11.025486717604972]
DSM5AgentFlowは、DSM-5 Level-1診断票を自律的に生成する最初のLCMベースのエージェントワークフローである。
特定のクライアントプロファイルでセラピストとクライアントの対話をシミュレートすることで、このフレームワークは透明でステップバイステップの障害予測を提供する。
このワークフローは、精神的な健康診断のための補完的なツールとして機能し、倫理的および法的基準の遵守を保証する。
論文 参考訳(メタデータ) (2025-08-15T11:08:32Z) - MLlm-DR: Towards Explainable Depression Recognition with MultiModal Large Language Models [28.873959594226605]
自動うつ病診断は、インタビュービデオからのマルチモーダル情報を分析し、参加者のうつ病スコアを予測することを目的としている。
これまでの研究では、これらのスコアがどのように決定されたかを明確に説明できず、臨床実践における導入を制限することが多かった。
本稿では,マルチモーダル情報入力を理解でき,説明可能なうつ病診断を支援する新しい多モーダル大言語モデル(MLlm-DR)を提案する。
論文 参考訳(メタデータ) (2025-07-08T01:56:39Z) - Silence is Not Consensus: Disrupting Agreement Bias in Multi-Agent LLMs via Catfish Agent for Clinical Decision Making [80.94208848596215]
提案する概念は「Catfish Agent」である。これは、構造的不満を注入し、無声な合意に反するように設計された役割特化LDMである。
組織心理学において「ナマズ・エフェクト」にインスパイアされたカマズ・エージェントは、より深い推論を促進するために、新たなコンセンサスに挑戦するように設計されている。
論文 参考訳(メタデータ) (2025-05-27T17:59:50Z) - AGIR: Assessing 3D Gait Impairment with Reasoning based on LLMs [0.0]
歩行障害は、神経変性疾患の早期診断、疾患モニタリング、治療評価において重要な役割を果たす。
近年のディープラーニングベースのアプローチは、分類精度を一貫して改善しているが、解釈可能性に欠けることが多い。
本稿では、事前訓練されたVQ-VAEモーショントークンライザと、一対のモーショントークン上で微調整されたLarge Language Model(LLM)からなる新しいパイプラインであるAGIRを紹介する。
論文 参考訳(メタデータ) (2025-03-23T17:12:16Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。