論文の概要: DepressLLM: Interpretable domain-adapted language model for depression detection from real-world narratives
- arxiv url: http://arxiv.org/abs/2508.08591v1
- Date: Tue, 12 Aug 2025 03:12:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.283445
- Title: DepressLLM: Interpretable domain-adapted language model for depression detection from real-world narratives
- Title(参考訳): DepressLLM:現実世界の物語からの抑うつ検出のための解釈可能なドメイン適応言語モデル
- Authors: Sehwan Moon, Aram Lee, Jeong Eun Kim, Hee-Ju Kang, Il-Seon Shin, Sung-Wan Kim, Jae-Min Kim, Min Jhon, Ju-Wan Kim,
- Abstract要約: 本研究では,幸福と苦悩の両方を反映した3,699個の自伝的物語のコーパスをトレーニングし,評価したDepressLLMを紹介する。
DepressLLMは解釈可能な抑うつ予測を提供し、Score-guided Token Probability Summation (SToPS)モジュールを通じて、改善された分類性能と信頼性の高い信頼推定を提供する。
- 参考スコア(独自算出の注目度): 6.1211540596331755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advances in large language models (LLMs) have enabled a wide range of applications. However, depression prediction is hindered by the lack of large-scale, high-quality, and rigorously annotated datasets. This study introduces DepressLLM, trained and evaluated on a novel corpus of 3,699 autobiographical narratives reflecting both happiness and distress. DepressLLM provides interpretable depression predictions and, via its Score-guided Token Probability Summation (SToPS) module, delivers both improved classification performance and reliable confidence estimates, achieving an AUC of 0.789, which rises to 0.904 on samples with confidence $\geq$ 0.95. To validate its robustness to heterogeneous data, we evaluated DepressLLM on in-house datasets, including an Ecological Momentary Assessment (EMA) corpus of daily stress and mood recordings, and on public clinical interview data. Finally, a psychiatric review of high-confidence misclassifications highlighted key model and data limitations that suggest directions for future refinements. These findings demonstrate that interpretable AI can enable earlier diagnosis of depression and underscore the promise of medical AI in psychiatry.
- Abstract(参考訳): 大規模言語モデル(LLM)の進歩により、幅広いアプリケーションが可能になった。
しかし、抑うつ予測は、大規模で高品質で厳密な注釈付きデータセットの欠如によって妨げられている。
本研究では,幸福と苦悩の両方を反映した3,699個の自伝的物語のコーパスをトレーニングし,評価したDepressLLMを紹介する。
DepressLLM は解釈可能な抑うつ予測を提供し、Score-guided Token Probability Summation (SToPS) モジュールを通じて、改良された分類性能と信頼性の高い信頼推定の両方を提供する。
異種データに対するロバスト性を評価するため, 環境モメンタリーアセスメント(EMA)コーパスや, 公的な臨床面接データなど, 社内データセット上でのDepressLLMの評価を行った。
最後に、高信頼の誤分類に関する精神医学的なレビューは、将来の改良に向けた方向性を示す重要なモデルとデータ制限を強調した。
これらの結果は、解釈可能なAIがうつ病の早期診断を可能にし、精神医学における医療AIの約束を裏付けることを示している。
関連論文リスト
- A Gold Standard Dataset and Evaluation Framework for Depression Detection and Explanation in Social Media using LLMs [0.0]
オンラインソーシャルメディア投稿からうつ病の早期発見は、タイムリーなメンタルヘルス介入を提供するという約束を掲げている。
抑うつ的スパンをラベル付けした1017のソーシャルメディア投稿を,12の抑うつ症状カテゴリにマッピングし,高品質で専門家による注釈付きデータセットを提示する。
論文 参考訳(メタデータ) (2025-07-26T10:01:55Z) - Uncertainty-aware abstention in medical diagnosis based on medical texts [87.88110503208016]
本研究は,AI支援医療診断における信頼性の重要課題について論じる。
本研究は,診断に自信がなければ,診断システムによる意思決定の回避を可能にする選択予測手法に焦点をあてる。
我々は、選択予測タスクにおける信頼性を高めるための新しい最先端手法であるHUQ-2を紹介する。
論文 参考訳(メタデータ) (2025-02-25T10:15:21Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - A BERT-Based Summarization approach for depression detection [1.7363112470483526]
うつ病は世界中で流行する精神疾患であり、対処されないと深刻な反感を引き起こす可能性がある。
機械学習と人工知能は、さまざまなデータソースからのうつ病指標を自律的に検出することができる。
本研究では,入力テキストの長さと複雑さを低減させる前処理手法として,テキスト要約を提案する。
論文 参考訳(メタデータ) (2024-09-13T02:14:34Z) - Depression Detection on Social Media with Large Language Models [23.075317886505193]
抑うつ検出は、ソーシャルメディア上の投稿履歴を分析して、個人が抑うつに苦しむかどうかを判断することを目的としている。
本稿では,医学的知識と大規模言語モデルの最近の進歩を融合した,DORISと呼ばれる新規なうつ病検出システムを提案する。
論文 参考訳(メタデータ) (2024-03-16T01:01:16Z) - Mental Health Diagnosis in the Digital Age: Harnessing Sentiment
Analysis on Social Media Platforms upon Ultra-Sparse Feature Content [3.6195994708545016]
3次元構造を持つ新しい意味的特徴前処理手法を提案する。
強化されたセマンティック機能により、精神障害を予測および分類するために機械学習モデルを訓練する。
提案手法は,7つのベンチマークモデルと比較して,大幅な性能向上を示した。
論文 参考訳(メタデータ) (2023-11-09T00:15:06Z) - The Relationship Between Speech Features Changes When You Get Depressed:
Feature Correlations for Improving Speed and Performance of Depression
Detection [69.88072583383085]
この研究は、抑うつが音声から抽出した特徴間の相関を変化させることを示す。
このような洞察を用いることで、SVMとLSTMに基づく抑うつ検出器のトレーニング速度と性能を向上させることができる。
論文 参考訳(メタデータ) (2023-07-06T09:54:35Z) - DECK: Behavioral Tests to Improve Interpretability and Generalizability
of BERT Models Detecting Depression from Text [4.269268432906194]
テキストからうつ病を正確に検出するモデルは、パンデミック後の精神疾患に対処するための重要なツールである。
BERTベースの分類器の有望な性能と市販の可用性は、このタスクの優れた候補となる。
DeCK(Depression ChecKlist)は、抑うつ特異的なモデル行動テストで、より優れた解釈性を実現する。
論文 参考訳(メタデータ) (2022-09-12T14:39:46Z) - Journaling Data for Daily PHQ-2 Depression Prediction and Forecasting [47.93070579578704]
我々は,新たに収集した時系列データセット上で,アクティブに収集されたデータを用いて,毎日のPHQ-2スコアを予測し,予測する可能性を探る。
PHQ-2 スコアの日次予測には 1.417 の MAE が最適である。
これは、うつ病モニタリングアプリケーションにアクティブに収集されたデータを組み込むことで得られる付加価値を示す。
論文 参考訳(メタデータ) (2022-05-06T17:47:05Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。