論文の概要: A Layered Multi-Expert Framework for Long-Context Mental Health Assessments
- arxiv url: http://arxiv.org/abs/2501.13951v2
- Date: Fri, 07 Feb 2025 20:22:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:27:14.711988
- Title: A Layered Multi-Expert Framework for Long-Context Mental Health Assessments
- Title(参考訳): 長期メンタルヘルスアセスメントのための階層型多機能フレームワーク
- Authors: Jinwen Tang, Qiming Guo, Wenbo Sun, Yi Shang,
- Abstract要約: Stacked Multi-Model Reasoning (SMMR)は、複数のモデルを等価な'専門家'として活用する階層化フレームワークである。
DAIC-WOZうつ病スクリーニングデータセットを用いてSMMRを評価し,48例の精神科診断症例について検討した。
多様な「第2の意見」を活用することで、SMMRは幻覚を緩和し、微妙な臨床的ニュアンスを捉え、高い精神健康評価の信頼性を高める。
- 参考スコア(独自算出の注目度): 8.558886345598253
- License:
- Abstract: Long-form mental health assessments pose unique challenges for large language models (LLMs), which often exhibit hallucinations or inconsistent reasoning when handling extended, domain-specific contexts. We introduce Stacked Multi-Model Reasoning (SMMR), a layered framework that leverages multiple LLMs and specialized smaller models as coequal 'experts'. Early layers isolate short, discrete subtasks, while later layers integrate and refine these partial outputs through more advanced long-context models. We evaluate SMMR on the DAIC-WOZ depression-screening dataset and 48 curated case studies with psychiatric diagnoses, demonstrating consistent improvements over single-model baselines in terms of accuracy, F1-score, and PHQ-8 error reduction. By harnessing diverse 'second opinions', SMMR mitigates hallucinations, captures subtle clinical nuances, and enhances reliability in high-stakes mental health assessments. Our findings underscore the value of multi-expert frameworks for more trustworthy AI-driven screening.
- Abstract(参考訳): 長期のメンタルヘルスアセスメントは、大規模言語モデル(LLM)に固有の課題をもたらし、拡張されたドメイン固有のコンテキストを扱う際には、幻覚や矛盾した推論を示すことが多い。
マルチモデル推論(SMMR: Stacked Multi-Model Reasoning)は,複数の LLM と,より小型のモデルを等価な '専門家' として活用する階層化フレームワークである。
初期層は短い個別のサブタスクを分離し、後期層はより高度な長文モデルを通してこれらの部分出力を統合し、洗練する。
我々は,DAIC-WOZうつ病スクリーニングデータセットと48例の精神診断症例を用いてSMMRを評価し,精度,F1スコア,PHQ-8の誤差低減の点において,単一モデルベースラインに対する一貫した改善が示された。
多様な「第二の意見」を活用することで、SMMRは幻覚を緩和し、微妙な臨床的ニュアンスを捉え、高い精神健康評価の信頼性を高める。
我々の発見は、より信頼できるAI駆動スクリーニングのためのマルチエキスパートフレームワークの価値を裏付けるものだ。
関連論文リスト
- Limitations of Large Language Models in Clinical Problem-Solving Arising from Inflexible Reasoning [3.3482359447109866]
LLM(Large Language Models)は、医療質問応答(QA)ベンチマークにおいて人間レベルの精度を達成した。
オープンエンドの臨床シナリオをナビゲートする際の制限が最近示されている。
医学的抽象化と推論コーパス(M-ARC)について紹介する。
現状のo1モデルやGeminiモデルを含むLSMは,M-ARCの医師と比較して性能が劣ることがわかった。
論文 参考訳(メタデータ) (2025-02-05T18:14:27Z) - MVICAD2: Multi-View Independent Component Analysis with Delays and Dilations [61.59658203704757]
本稿では,時間的遅延と拡張の両面において,被験者間でソースを異にするMVICAD(Multi-View Independent Component Analysis with Delays and Dilations)を提案する。
本稿では, 正則化と最適化手法を用いて, 性能向上を図るため, 正則化と最適化手法を用いて, その可能性の近似を導出する。
論文 参考訳(メタデータ) (2025-01-13T15:47:02Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation [89.3260120072177]
本稿では,放射線学レポート生成のための歴史制約付き大規模言語モデル (HC-LLM) フレームワークを提案する。
胸部X線写真から経時的特徴と経時的特徴を抽出し,疾患の進行を捉える診断報告を行った。
特に,本手法は,テスト中の履歴データなしでも良好に動作し,他のマルチモーダル大規模モデルにも容易に適用可能である。
論文 参考訳(メタデータ) (2024-12-15T06:04:16Z) - The Curse of Multi-Modalities: Evaluating Hallucinations of Large Multimodal Models across Language, Visual, and Audio [118.75449542080746]
本稿では,大規模マルチモーダルモデル(LMM)における幻覚に関する最初の系統的研究について述べる。
本研究は,幻覚に対する2つの重要な要因を明らかにした。
私たちの研究は、モダリティ統合の不均衡やトレーニングデータからのバイアスなど、重要な脆弱性を強調し、モダリティ間のバランスの取れた学習の必要性を強調した。
論文 参考訳(メタデータ) (2024-10-16T17:59:02Z) - LoRKD: Low-Rank Knowledge Decomposition for Medical Foundation Models [59.961172635689664]
知識分解」は、特定の医療課題のパフォーマンス向上を目的としている。
我々はLow-Rank Knowledge Decomposition(LoRKD)という新しいフレームワークを提案する。
LoRKDは、低ランクのエキスパートモジュールと効率的な知識分離畳み込みを組み込むことで、グラデーションを異なるタスクから明確に分離する。
論文 参考訳(メタデータ) (2024-09-29T03:56:21Z) - RJUA-MedDQA: A Multimodal Benchmark for Medical Document Question
Answering and Clinical Reasoning [14.366349078707263]
RJUA-MedDQAは医学専門分野における総合的なベンチマークである。
本稿では医学専門分野の総合的なベンチマークであるRJUA-MedDQAを紹介する。
論文 参考訳(メタデータ) (2024-02-19T06:57:02Z) - Self-supervised multimodal neuroimaging yields predictive
representations for a spectrum of Alzheimer's phenotypes [27.331511924585023]
この研究は、マルチモーダル・ニューロイメージングデータから複数の表現を学習するための、新しいマルチスケール協調フレームワークを提案する。
本稿では,情報誘導バイアスの一般的な分類法を提案する。
自己教師型モデルでは,事前トレーニング中にラベルにアクセスすることなく,障害関連脳領域とマルチモーダルリンクを明らかにする。
論文 参考訳(メタデータ) (2022-09-07T01:37:19Z) - MEDUSA: Multi-scale Encoder-Decoder Self-Attention Deep Neural Network
Architecture for Medical Image Analysis [71.2022403915147]
医用画像解析に適したマルチスケールエンコーダデコーダ自己保持機構であるMEDUSAを紹介する。
我々は、COVIDx、RSNA RICORD、RSNA Pneumonia Challengeなどの医療画像分析ベンチマークの最先端性能を得た。
論文 参考訳(メタデータ) (2021-10-12T15:05:15Z) - On self-supervised multi-modal representation learning: An application
to Alzheimer's disease [21.495288589801476]
機能的および構造的脳イメージングを訓練した深い教師付き予測モデルのイントロスペクションはアルツハイマー病の新しいマーカーを明らかにするかもしれない
深い教師なし、そして近年では、分類に偏らない対照的な自己監督的アプローチが、このタスクのより良い候補である。
論文 参考訳(メタデータ) (2020-12-25T19:51:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。