論文の概要: Leveraging Large Language Models for Cost-Effective, Multilingual Depression Detection and Severity Assessment
- arxiv url: http://arxiv.org/abs/2504.04891v1
- Date: Mon, 07 Apr 2025 09:58:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 20:32:30.409539
- Title: Leveraging Large Language Models for Cost-Effective, Multilingual Depression Detection and Severity Assessment
- Title(参考訳): コスト効果・多言語抑うつ検出・重症度評価のための大規模言語モデルの活用
- Authors: Longdi Xian, Jianzhang Ni, Mingzhu Wang,
- Abstract要約: DeepSeek V3はうつ病検出の最も信頼性が高く費用対効果の高いモデルである。
このモデルは、複雑な診断シナリオにおける抑うつを検出するために、安定して高いAUCを維持している。
- 参考スコア(独自算出の注目度): 0.7373617024876725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depression is a prevalent mental health disorder that is difficult to detect early due to subjective symptom assessments. Recent advancements in large language models have offered efficient and cost-effective approaches for this objective. In this study, we evaluated the performance of four LLMs in depression detection using clinical interview data. We selected the best performing model and further tested it in the severity evaluation scenario and knowledge enhanced scenario. The robustness was evaluated in complex diagnostic scenarios using a dataset comprising 51074 statements from six different mental disorders. We found that DeepSeek V3 is the most reliable and cost-effective model for depression detection, performing well in both zero-shot and few-shot scenarios, with zero-shot being the most efficient choice. The evaluation of severity showed low agreement with the human evaluator, particularly for mild depression. The model maintains stably high AUCs for detecting depression in complex diagnostic scenarios. These findings highlight DeepSeek V3s strong potential for text-based depression detection in real-world clinical applications. However, they also underscore the need for further refinement in severity assessment and the mitigation of potential biases to enhance clinical reliability.
- Abstract(参考訳): うつ病は、主観的症状評価による早期発見が難しい精神疾患である。
大規模言語モデルの最近の進歩は、この目的のために効率的で費用対効果の高いアプローチを提供してきた。
本研究では,臨床面接データを用いた抑うつ検出における4つのLDMの性能評価を行った。
我々は、最高のパフォーマンスモデルを選択し、重度評価シナリオと知識強化シナリオでさらにテストした。
6つの異なる精神疾患の51074文からなるデータセットを用いて、複雑な診断シナリオにおいてロバスト性を評価した。
We found that DeepSeek V3 is the most reliable and cost- Effective model for depression detection, are well in both zero-shot and few-shot scenarios, with zero-shot is most efficient choice。
重症度の評価は, 人的評価者, 特に軽度抑うつ者に対して低一致を示した。
このモデルは、複雑な診断シナリオにおける抑うつを検出するために、安定して高いAUCを維持している。
これらの知見は、実際の臨床応用におけるテキストベースのうつ病検出の強力な可能性を示すものである。
しかし、彼らはまた、重症度評価のさらなる改善の必要性と、臨床の信頼性を高めるための潜在的なバイアスの軽減の必要性を強調している。
関連論文リスト
- Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - Uncertainty-aware abstention in medical diagnosis based on medical texts [87.88110503208016]
本研究は,AI支援医療診断における信頼性の重要課題について論じる。
本研究は,診断に自信がなければ,診断システムによる意思決定の回避を可能にする選択予測手法に焦点をあてる。
我々は、選択予測タスクにおける信頼性を高めるための新しい最先端手法であるHUQ-2を紹介する。
論文 参考訳(メタデータ) (2025-02-25T10:15:21Z) - Enhancing Depression Detection with Chain-of-Thought Prompting: From Emotion to Reasoning Using Large Language Models [9.43184936918456]
うつ病は世界中で障害の主な原因の1つである。
大規模言語モデルの最近の進歩は、精神的な健康問題に対処する上で有望であることを示している。
そこで本研究では,抑うつ検出の性能と解釈性を両立するChain-of-Thought Prompting手法を提案する。
論文 参考訳(メタデータ) (2025-02-09T12:30:57Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - GPT-4 on Clinic Depression Assessment: An LLM-Based Pilot Study [0.6999740786886538]
転写解析に基づく臨床うつ病評価におけるGPT-4の使用について検討した。
本稿では,患者インタビューを2つのカテゴリーに分類するモデルの能力について検討する。
その結果, GPT-4の精度およびF1スコアは, 構成によって大きく変動することが示唆された。
論文 参考訳(メタデータ) (2024-12-31T00:32:43Z) - A BERT-Based Summarization approach for depression detection [1.7363112470483526]
うつ病は世界中で流行する精神疾患であり、対処されないと深刻な反感を引き起こす可能性がある。
機械学習と人工知能は、さまざまなデータソースからのうつ病指標を自律的に検出することができる。
本研究では,入力テキストの長さと複雑さを低減させる前処理手法として,テキスト要約を提案する。
論文 参考訳(メタデータ) (2024-09-13T02:14:34Z) - Assessing ML Classification Algorithms and NLP Techniques for Depression Detection: An Experimental Case Study [0.6524460254566905]
うつ病は世界中で何百万人もの人々に影響を与えており、最も一般的な精神疾患の1つとなっている。
近年の研究では、機械学習(ML)と自然言語処理(NLP)のツールや技術がうつ病の診断に広く用いられていることが証明されている。
しかし, 外傷後ストレス障害 (PTSD) などの他の症状が存在するうつ病検出アプローチの評価には, 依然としていくつかの課題がある。
論文 参考訳(メタデータ) (2024-04-03T19:45:40Z) - Depression Detection on Social Media with Large Language Models [23.075317886505193]
抑うつ検出は、ソーシャルメディア上の投稿履歴を分析して、個人が抑うつに苦しむかどうかを判断することを目的としている。
本稿では,医学的知識と大規模言語モデルの最近の進歩を融合した,DORISと呼ばれる新規なうつ病検出システムを提案する。
論文 参考訳(メタデータ) (2024-03-16T01:01:16Z) - Empowering Psychotherapy with Large Language Models: Cognitive
Distortion Detection through Diagnosis of Thought Prompting [82.64015366154884]
本研究では,認知的歪み検出の課題について検討し,思考の早期発見(DoT)を提案する。
DoTは、事実と思考を分離するための主観的評価、思考と矛盾する推論プロセスを引き出すための対照的な推論、認知スキーマを要約するスキーマ分析という3つの段階を通して、患者のスピーチの診断を行う。
実験により、DoTは認知的歪み検出のためのChatGPTよりも大幅に改善され、一方で人間の専門家が承認した高品質な合理性を生成することが示された。
論文 参考訳(メタデータ) (2023-10-11T02:47:21Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。