論文の概要: "Mirror" Language AI Models of Depression are Criterion-Contaminated
- arxiv url: http://arxiv.org/abs/2508.05830v2
- Date: Fri, 17 Oct 2025 20:58:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:09.025879
- Title: "Mirror" Language AI Models of Depression are Criterion-Contaminated
- Title(参考訳): 誤り」言語AIモデルが基準に適合
- Authors: Tong Li, Rasiq Hussain, Mehak Gupta, Joshua R. Oltmanns,
- Abstract要約: 誤り」モデルは、うつ病評価スコアを予測するために、うつ病評価から直接言語反応に依存する。
我々は「ミス」モデルと「ノンミス」モデルを比較し、他の外部言語を用いて抑うつスコアを予測する。
- 参考スコア(独自算出の注目度): 2.8006821364328847
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent studies show near-perfect language-based predictions of depression scores (R2 = .70), but these "Mirror" models rely on language responses directly from depression assessments to predict depression assessment scores. These methods suffer from criterion contamination that inflate prediction estimates. We compare "Mirror" models to "Non-Mirror" models, which use other external language to predict depression scores. 110 participants completed both structured diagnostic (Mirror condition) and life history (Non-Mirror condition) interviews. LLMs were prompted to predict diagnostic depression scores. As expected, Mirror models were near-perfect. However, Non-Mirror models also displayed prediction sizes considered large in psychology. Further, both Mirror and Non-Mirror predictions correlated with other questionnaire-based depression symptoms at similar sizes, suggesting bias in Mirror models. Topic modeling revealed different theme structures across model types. As language models for depression continue to evolve, incorporating Non-Mirror approaches may support more valid and clinically useful language-based AI applications in psychological assessment.
- Abstract(参考訳): 近年の研究では、うつ病スコアのほぼ完全な言語に基づく予測(R2 = .70)が示されているが、これらの「ミス」モデルはうつ病評価から直接言語反応に依存してうつ病評価スコアを予測する。
これらの方法は、予測推定をインフレーションする基準汚染に悩まされる。
我々は「ミス」モデルと「ノンミス」モデルを比較し、他の外部言語を用いて抑うつスコアを予測する。
110名の被験者が構造化診断(ミス状態)と生活史(ノンミス状態)の面接を完了した。
LLMは診断うつ病のスコアを予測するよう促された。
予想通りミラーモデルはほぼ完璧だった。
しかし、非ミラーモデルは心理学において大きいと考えられる予測サイズも示していた。
さらに、ミラーモデルと非ミラー予測は、同じ大きさの他のアンケートに基づくうつ症状と相関し、ミラーモデルにおけるバイアスが示唆された。
トピックモデリングでは、モデルの種類によって異なるテーマ構造が明らかになった。
抑うつのための言語モデルは進化し続けており、非ミラーアプローチの導入は、心理学的評価においてより有効で臨床的に有用な言語ベースのAIアプリケーションをサポートする可能性がある。
関連論文リスト
- On the Validity of Head Motion Patterns as Generalisable Depression Biomarkers [5.251042759836316]
本研究は,うつ病重症度推定のための基本頭部運動単位を用いたモデルの有効性と一般性について検討する。
異なる西欧文化からの3つの抑うつデータセットを考察し, キネムパターンの一般化可能性について検討した。
1) 頭部運動パターンは, 抑うつの重症度を推定するための効果的なバイオマーカーであり, 分類と回帰の両タスクにおいて高い競争力を発揮する。
論文 参考訳(メタデータ) (2025-05-29T13:22:30Z) - Bigger But Not Better: Small Neural Language Models Outperform Large Language Models in Detection of Thought Disorder [7.585589727435719]
より小さなニューラルネットワークモデルが正の形式的思考障害の検出に有効な選択肢となるかどうかを検討する。
意外なことに,本研究の結果は,より小さなモデルの方が,形式的思考障害に関連する言語的差異に敏感であることが示唆された。
論文 参考訳(メタデータ) (2025-03-25T22:55:58Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Robust Speech and Natural Language Processing Models for Depression Screening [0.0]
うつ病は世界的な健康上の問題であり、患者スクリーニングの強化が不可欠である。
この目的のために開発された2つのディープラーニングモデルについて述べる。
1つのモデルは音響に基づいており、もう1つは自然言語処理に基づいている。
論文 参考訳(メタデータ) (2024-12-26T06:05:52Z) - Generative causal testing to bridge data-driven models and scientific theories in language neuroscience [82.995061475971]
脳における言語選択性の簡潔な説明を生成するためのフレームワークである生成因果テスト(GCT)を提案する。
GCTは機能的選択性に類似した脳領域の細粒度の違いを識別できることを示す。
論文 参考訳(メタデータ) (2024-10-01T15:57:48Z) - Evaluating Model Bias Requires Characterizing its Mistakes [19.777130236160712]
スキューサイズ(SkewSize)は、モデルの予測における誤りからバイアスを捉える、原則付きフレキシブルなメトリクスである。
マルチクラスの設定で使用したり、生成モデルのオープンな語彙設定に一般化することができる。
合成データで訓練された標準的な視覚モデル、ImageNetで訓練された視覚モデル、BLIP-2ファミリーの大規模視覚言語モデルなどである。
論文 参考訳(メタデータ) (2024-07-15T11:46:21Z) - Development and Validation of a Deep-Learning Model for Differential Treatment Benefit Prediction for Adults with Major Depressive Disorder Deployed in the Artificial Intelligence in Depression Medication Enhancement (AIDME) Study [0.622895724042048]
大うつ病(MDD)の薬理学的治療は、試行錯誤のアプローチに依存している。
治療結果のパーソナライズを目的とした人工知能(AI)モデルを導入する。
論文 参考訳(メタデータ) (2024-06-07T15:04:59Z) - The Relationship Between Speech Features Changes When You Get Depressed:
Feature Correlations for Improving Speed and Performance of Depression
Detection [69.88072583383085]
この研究は、抑うつが音声から抽出した特徴間の相関を変化させることを示す。
このような洞察を用いることで、SVMとLSTMに基づく抑うつ検出器のトレーニング速度と性能を向上させることができる。
論文 参考訳(メタデータ) (2023-07-06T09:54:35Z) - Bayesian Networks for the robust and unbiased prediction of depression
and its symptoms utilizing speech and multimodal data [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。