論文の概要: Multilingual Lexical Feature Analysis of Spoken Language for Predicting Major Depression Symptom Severity
- arxiv url: http://arxiv.org/abs/2511.07011v1
- Date: Mon, 10 Nov 2025 12:03:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.2293
- Title: Multilingual Lexical Feature Analysis of Spoken Language for Predicting Major Depression Symptom Severity
- Title(参考訳): 重度抑うつ症状の重症度予測のための音声言語の多言語語彙的特徴分析
- Authors: Anastasiia Tokareva, Judith Dineley, Zoe Firth, Pauline Conde, Faith Matcham, Sara Siddi, Femke Lamers, Ewan Carr, Carolin Oetzmann, Daniel Leightley, Yuezhou Zhang, Amos A. Folarin, Josep Maria Haro, Brenda W. J. H. Penninx, Raquel Bailon, Srinivasan Vairavan, Til Wykes, Richard J. B. Dobson, Vaibhav A. Narayan, Matthew Hotopf, Nicholas Cummins, The RADAR-CNS Consortium,
- Abstract要約: 英国, オランダ, スペインで586人の参加者の5,836人の音声データとPHQ-8アセスメントの探索分析を行った。
線形混合効果モデルを用いてMDD症状の重症度に関連する解釈可能な語彙の特徴を同定することを試みた。
英語では,MDD症状の重症度は,語彙的多様性尺度や絶対言語を含む7つの特徴と関連していた。
オランダ語では1文あたりの単語と肯定的な単語頻度で関連が観察され、スペインで収集された記録では関連は見られなかった。
- 参考スコア(独自算出の注目度): 5.950020142175479
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Background: Captured between clinical appointments using mobile devices, spoken language has potential for objective, more regular assessment of symptom severity and earlier detection of relapse in major depressive disorder. However, research to date has largely been in non-clinical cross-sectional samples of written language using complex machine learning (ML) approaches with limited interpretability. Methods: We describe an initial exploratory analysis of longitudinal speech data and PHQ-8 assessments from 5,836 recordings of 586 participants in the UK, Netherlands, and Spain, collected in the RADAR-MDD study. We sought to identify interpretable lexical features associated with MDD symptom severity with linear mixed-effects modelling. Interpretable features and high-dimensional vector embeddings were also used to test the prediction performance of four regressor ML models. Results: In English data, MDD symptom severity was associated with 7 features including lexical diversity measures and absolutist language. In Dutch, associations were observed with words per sentence and positive word frequency; no associations were observed in recordings collected in Spain. The predictive power of lexical features and vector embeddings was near chance level across all languages. Limitations: Smaller samples in non-English speech and methodological choices, such as the elicitation prompt, may have also limited the effect sizes observable. A lack of NLP tools in languages other than English restricted our feature choice. Conclusion: To understand the value of lexical markers in clinical research and practice, further research is needed in larger samples across several languages using improved protocols, and ML models that account for within- and between-individual variations in language.
- Abstract(参考訳): 背景: モバイル端末を用いた臨床予約とのあいだで、音声言語は、主観的、より定期的な症状重症度の評価と、うつ病性障害の早期発見の可能性を秘めている。
しかし、これまでの研究はほとんどが、複雑な機械学習(ML)アプローチによる、解釈可能性に制限のある書込み言語の非クリニカルな横断的なサンプルであった。
方法: RADAR-MDDで収集した5,836人の英国,オランダ,スペインの参加者の音声データとPHQ-8の評価値について検討した。
線形混合効果モデルを用いてMDD症状の重症度に関連する解釈可能な語彙の特徴を同定することを試みた。
また、4つの回帰MLモデルの予測性能をテストするために、解釈可能な特徴と高次元ベクトル埋め込みを用いた。
結果: 英語データではMDD症状の重症度は, 語彙的多様性尺度や絶対言語を含む7つの特徴と関連していた。
オランダ語では1文あたりの単語と肯定的な単語頻度で関連が観察され、スペインで収集された記録では関連は見られなかった。
語彙的特徴とベクトル埋め込みの予測力は、すべての言語でほぼ同レベルであった。
制限: 非英語音声におけるより小さなサンプルと、引用プロンプトのような方法論的選択は、観測可能な効果サイズを制限した可能性がある。
英語以外の言語でのNLPツールの欠如は、私たちの機能選択を制限しました。
結論: 臨床研究および実践における語彙的マーカーの価値を理解するためには, 改良されたプロトコルと言語内および個人間変異を考慮したMLモデルを用いて, 複数の言語にわたるより大きなサンプルにおいて, さらなる研究が必要である。
関連論文リスト
- The Emergence of Abstract Thought in Large Language Models Beyond Any Language [95.50197866832772]
大規模言語モデル(LLM)は様々な言語で効果的に機能する。
予備的研究では、LLMの隠れた活性化は、英語以外のプロンプトに反応してもしばしば英語に類似している。
近年の結果は多言語のパフォーマンスが強く、他の言語での特定のタスクにおける英語のパフォーマンスを超えている。
論文 参考訳(メタデータ) (2025-06-11T16:00:54Z) - Bigger But Not Better: Small Neural Language Models Outperform Large Language Models in Detection of Thought Disorder [7.585589727435719]
より小さなニューラルネットワークモデルが正の形式的思考障害の検出に有効な選択肢となるかどうかを検討する。
意外なことに,本研究の結果は,より小さなモデルの方が,形式的思考障害に関連する言語的差異に敏感であることが示唆された。
論文 参考訳(メタデータ) (2025-03-25T22:55:58Z) - A Comprehensive Evaluation of Large Language Models on Mental Illnesses in Arabic Context [0.9074663948713616]
メンタルヘルス障害はアラブ世界で公衆衛生の懸念が高まっている。
本研究は,多様なメンタルヘルスデータセットに基づいて,8つの大言語モデル(LLM)を包括的に評価する。
論文 参考訳(メタデータ) (2025-01-12T16:17:25Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Building Multilingual Datasets for Predicting Mental Health Severity through LLMs: Prospects and Challenges [3.0382033111760585]
大規模言語モデル(LLM)は、メンタルヘルス支援システムを含む様々な医療分野に統合されつつある。
本稿では、広く使われているメンタルヘルスデータセットを英語から6言語に翻訳した新しい多言語適応法を提案する。
このデータセットは、精神状態を検出し、複数の言語にわたる重症度を評価する上で、LLMのパフォーマンスを総合的に評価することを可能にする。
論文 参考訳(メタデータ) (2024-09-25T22:14:34Z) - Comparing Hallucination Detection Metrics for Multilingual Generation [62.97224994631494]
本稿では,各言語にまたがって生成した伝記要約における幻覚を,様々な事実の幻覚検出指標がいかによく識別するかを評価する。
自動測度が相互にどのように相関するか, 事実判断に一致しているかを比較検討した。
我々の分析によると、語彙指標は非効率であるが、NLIベースのメトリクスはよく機能し、多くの設定における人間のアノテーションと相関し、しばしば教師付きモデルよりも優れている。
論文 参考訳(メタデータ) (2024-02-16T08:10:34Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Semantic Coherence Markers for the Early Diagnosis of the Alzheimer
Disease [0.0]
パープレキシティはもともと、与えられた言語モデルがテキストシーケンスを予測するのにどの程度適しているかを評価するための情報理論の尺度として考え出された。
我々は2グラムから5グラムまでのN-gramとトランスフォーマーベース言語モデルであるGPT-2を多種多様な言語モデルに適用した。
ベストパフォーマンスモデルでは、ADクラスと制御対象の両方から対象を分類する際に、完全精度とFスコア(精度/特異度とリコール/感度のそれぞれ1.00)を達成した。
論文 参考訳(メタデータ) (2023-02-02T11:40:16Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。