Fugu-MT 論文翻訳(概要): "Mirror" Language AI Models of Depression are Criterion-Contaminated

論文の概要: "Mirror" Language AI Models of Depression are Criterion-Contaminated

arxiv url: http://arxiv.org/abs/2508.05830v2
Date: Fri, 17 Oct 2025 20:58:29 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-25 03:08:09.025879
Title: "Mirror" Language AI Models of Depression are Criterion-Contaminated
Title（参考訳）: 誤り」言語AIモデルが基準に適合
Authors: Tong Li, Rasiq Hussain, Mehak Gupta, Joshua R. Oltmanns,
Abstract要約: 誤り」モデルは、うつ病評価スコアを予測するために、うつ病評価から直接言語反応に依存する。我々は「ミス」モデルと「ノンミス」モデルを比較し、他の外部言語を用いて抑うつスコアを予測する。
参考スコア（独自算出の注目度）: 2.8006821364328847
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent studies show near-perfect language-based predictions of depression scores (R2 = .70), but these "Mirror" models rely on language responses directly from depression assessments to predict depression assessment scores. These methods suffer from criterion contamination that inflate prediction estimates. We compare "Mirror" models to "Non-Mirror" models, which use other external language to predict depression scores. 110 participants completed both structured diagnostic (Mirror condition) and life history (Non-Mirror condition) interviews. LLMs were prompted to predict diagnostic depression scores. As expected, Mirror models were near-perfect. However, Non-Mirror models also displayed prediction sizes considered large in psychology. Further, both Mirror and Non-Mirror predictions correlated with other questionnaire-based depression symptoms at similar sizes, suggesting bias in Mirror models. Topic modeling revealed different theme structures across model types. As language models for depression continue to evolve, incorporating Non-Mirror approaches may support more valid and clinically useful language-based AI applications in psychological assessment.
Abstract（参考訳）: 近年の研究では、うつ病スコアのほぼ完全な言語に基づく予測(R2 = .70)が示されているが、これらの「ミス」モデルはうつ病評価から直接言語反応に依存してうつ病評価スコアを予測する。これらの方法は、予測推定をインフレーションする基準汚染に悩まされる。我々は「ミス」モデルと「ノンミス」モデルを比較し、他の外部言語を用いて抑うつスコアを予測する。 110名の被験者が構造化診断(ミス状態)と生活史(ノンミス状態)の面接を完了した。 LLMは診断うつ病のスコアを予測するよう促された。予想通りミラーモデルはほぼ完璧だった。しかし、非ミラーモデルは心理学において大きいと考えられる予測サイズも示していた。さらに、ミラーモデルと非ミラー予測は、同じ大きさの他のアンケートに基づくうつ症状と相関し、ミラーモデルにおけるバイアスが示唆された。トピックモデリングでは、モデルの種類によって異なるテーマ構造が明らかになった。抑うつのための言語モデルは進化し続けており、非ミラーアプローチの導入は、心理学的評価においてより有効で臨床的に有用な言語ベースのAIアプリケーションをサポートする可能性がある。

関連論文リスト

DepressLLM: Interpretable domain-adapted language model for depression detection from real-world narratives [6.1211540596331755]
本研究では,幸福と苦悩の両方を反映した3,699個の自伝的物語のコーパスをトレーニングし,評価したDepressLLMを紹介する。 DepressLLMは解釈可能な抑うつ予測を提供し、Score-guided Token Probability Summation (SToPS)モジュールを通じて、改善された分類性能と信頼性の高い信頼推定を提供する。
論文参考訳（メタデータ） (2025-08-12T03:12:55Z)
On the Validity of Head Motion Patterns as Generalisable Depression Biomarkers [5.251042759836316]
本研究は,うつ病重症度推定のための基本頭部運動単位を用いたモデルの有効性と一般性について検討する。異なる西欧文化からの3つの抑うつデータセットを考察し, キネムパターンの一般化可能性について検討した。 1) 頭部運動パターンは, 抑うつの重症度を推定するための効果的なバイオマーカーであり, 分類と回帰の両タスクにおいて高い競争力を発揮する。
論文参考訳（メタデータ） (2025-05-29T13:22:30Z)
Bigger But Not Better: Small Neural Language Models Outperform Large Language Models in Detection of Thought Disorder [7.585589727435719]
より小さなニューラルネットワークモデルが正の形式的思考障害の検出に有効な選択肢となるかどうかを検討する。意外なことに,本研究の結果は,より小さなモデルの方が,形式的思考障害に関連する言語的差異に敏感であることが示唆された。
論文参考訳（メタデータ） (2025-03-25T22:55:58Z)
LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文参考訳（メタデータ） (2025-01-07T08:49:04Z)
Robust Speech and Natural Language Processing Models for Depression Screening [0.0]
うつ病は世界的な健康上の問題であり、患者スクリーニングの強化が不可欠である。この目的のために開発された2つのディープラーニングモデルについて述べる。 1つのモデルは音響に基づいており、もう1つは自然言語処理に基づいている。
論文参考訳（メタデータ） (2024-12-26T06:05:52Z)
Generative causal testing to bridge data-driven models and scientific theories in language neuroscience [82.995061475971]
脳における言語選択性の簡潔な説明を生成するためのフレームワークである生成因果テスト(GCT)を提案する。 GCTは機能的選択性に類似した脳領域の細粒度の違いを識別できることを示す。
論文参考訳（メタデータ） (2024-10-01T15:57:48Z)
Evaluating Model Bias Requires Characterizing its Mistakes [19.777130236160712]
スキューサイズ(SkewSize)は、モデルの予測における誤りからバイアスを捉える、原則付きフレキシブルなメトリクスである。マルチクラスの設定で使用したり、生成モデルのオープンな語彙設定に一般化することができる。合成データで訓練された標準的な視覚モデル、ImageNetで訓練された視覚モデル、BLIP-2ファミリーの大規模視覚言語モデルなどである。
論文参考訳（メタデータ） (2024-07-15T11:46:21Z)
LLM Questionnaire Completion for Automatic Psychiatric Assessment [49.1574468325115]
大規模言語モデル(LLM)を用いて、非構造的心理面接を、様々な精神科領域と人格領域にまたがる構造化された質問票に変換する。得られた回答は、うつ病の標準化された精神医学的指標(PHQ-8)とPTSD(PCL-C)の予測に使用される特徴として符号化される。
論文参考訳（メタデータ） (2024-06-09T09:03:11Z)
Development and Validation of a Deep-Learning Model for Differential Treatment Benefit Prediction for Adults with Major Depressive Disorder Deployed in the Artificial Intelligence in Depression Medication Enhancement (AIDME) Study [0.622895724042048]
大うつ病(MDD)の薬理学的治療は、試行錯誤のアプローチに依存している。治療結果のパーソナライズを目的とした人工知能(AI)モデルを導入する。
論文参考訳（メタデータ） (2024-06-07T15:04:59Z)
Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文参考訳（メタデータ） (2024-04-26T16:39:50Z)
Assessing ML Classification Algorithms and NLP Techniques for Depression Detection: An Experimental Case Study [0.6524460254566905]
うつ病は世界中で何百万人もの人々に影響を与えており、最も一般的な精神疾患の1つとなっている。近年の研究では、機械学習(ML)と自然言語処理(NLP)のツールや技術がうつ病の診断に広く用いられていることが証明されている。しかし, 外傷後ストレス障害 (PTSD) などの他の症状が存在するうつ病検出アプローチの評価には, 依然としていくつかの課題がある。
論文参考訳（メタデータ） (2024-04-03T19:45:40Z)
The Relationship Between Speech Features Changes When You Get Depressed: Feature Correlations for Improving Speed and Performance of Depression Detection [69.88072583383085]
この研究は、抑うつが音声から抽出した特徴間の相関を変化させることを示す。このような洞察を用いることで、SVMとLSTMに基づく抑うつ検出器のトレーニング速度と性能を向上させることができる。
論文参考訳（メタデータ） (2023-07-06T09:54:35Z)
Bayesian Networks for the robust and unbiased prediction of depression and its symptoms utilizing speech and multimodal data [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文参考訳（メタデータ） (2022-11-09T14:48:13Z)
Naturalistic Causal Probing for Morpho-Syntax [76.83735391276547]
スペインにおける実世界のデータに対する入力レベルの介入に対する自然主義的戦略を提案する。提案手法を用いて,共同設立者から文章中の形態・症状の特徴を抽出する。本研究では,事前学習したモデルから抽出した文脈化表現に対する性別と数字の因果効果を解析するために,本手法を適用した。
論文参考訳（メタデータ） (2022-05-14T11:47:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。