論文の概要: Linguistic Indicators of Early Cognitive Decline in the DementiaBank Pitt Corpus: A Statistical and Machine Learning Study
- arxiv url: http://arxiv.org/abs/2602.11028v1
- Date: Wed, 11 Feb 2026 16:53:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:02.214119
- Title: Linguistic Indicators of Early Cognitive Decline in the DementiaBank Pitt Corpus: A Statistical and Machine Learning Study
- Title(参考訳): Dementia Bank Pitt Corpusにおける早期認知低下の言語指標:統計的および機械学習による研究
- Authors: Artsvik Avetisyan, Sachin Kumar,
- Abstract要約: 本研究では,3つの言語表現を用いて,DementiaBank Pitt Corpusからの自発音声の書き起こしを分析する。
構文的および文法的特徴は、語彙内容が欠如していても、強力な識別力を保持する。
本研究は,透明で信頼性の高い言語ベース認知スクリーニングにおける言語基盤機能の利用を支援する。
- 参考スコア(独自算出の注目度): 4.417564179511245
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Background: Subtle changes in spontaneous language production are among the earliest indicators of cognitive decline. Identifying linguistically interpretable markers of dementia can support transparent and clinically grounded screening approaches. Methods: This study analyzes spontaneous speech transcripts from the DementiaBank Pitt Corpus using three linguistic representations: raw cleaned text, a part-of-speech (POS)-enhanced representation combining lexical and grammatical information, and a POS-only syntactic representation. Logistic regression and random forest models were evaluated under two protocols: transcript-level train-test splits and subject-level five-fold cross-validation to prevent speaker overlap. Model interpretability was examined using global feature importance, and statistical validation was conducted using Mann-Whitney U tests with Cliff's delta effect sizes. Results: Across representations, models achieved stable performance, with syntactic and grammatical features retaining strong discriminative power even in the absence of lexical content. Subject-level evaluation yielded more conservative but consistent results, particularly for POS-enhanced and POS-only representations. Statistical analysis revealed significant group differences in functional word usage, lexical diversity, sentence structure, and discourse coherence, aligning closely with machine learning feature importance findings. Conclusion: The results demonstrate that abstract linguistic features capture robust markers of early cognitive decline under clinically realistic evaluation. By combining interpretable machine learning with non-parametric statistical validation, this study supports the use of linguistically grounded features for transparent and reliable language-based cognitive screening.
- Abstract(参考訳): 背景: 自発言語生産における部分的変化は認知低下の最も初期の指標である。
言語学的に解釈可能な認知症のマーカーを同定することは、透明で臨床的に根拠付けられたスクリーニングアプローチを支援することができる。
方法:本研究では,3つの言語表現を用いて,DementiaBank Pitt Corpusからの自発音声の書き起こしを解析した。
可逆回帰モデルとランダム森林モデルとを2つのプロトコルで評価した。
大域的特徴量を用いてモデル解釈可能性について検討し, クリフのデルタ効果サイズを用いたマン・ホイットニーU試験を用いて統計的検証を行った。
結果: 構文的特徴と文法的特徴は, 語彙内容が欠如していても, 強い識別力を有する。
主観評価はより保守的だが一貫した結果を得た。
統計的分析の結果,機能的単語使用,語彙的多様性,文構造,言論的コヒーレンスに有意なグループ差がみられ,機械学習の特徴的重要度と密接に一致していた。
結論: この結果から, 抽象言語学的特徴は, 臨床的に現実的な評価の下で, 早期認知低下の堅牢なマーカーを捉えていることが示唆された。
本研究は、解釈可能な機械学習と非パラメトリック統計的検証を組み合わせることで、透明で信頼性の高い言語ベースの認知スクリーニングにおける言語基盤機能の利用を支援する。
関連論文リスト
- Tokenization and Morphological Fidelity in Uralic NLP: A Cross-Lingual Evaluation [9.23725598061561]
本研究は3つのサブワードパラダイムであるByte Pairを体系的に比較する。
BPE(Overlap BPE)、OBPE(Overlap BPE)、Unigram Language Model(Unigram Language Model)。
OBPEは従来手法よりも強い形態的アライメントとタグ付け精度を実現する。
論文 参考訳(メタデータ) (2026-02-04T05:59:25Z) - Early Linguistic Pattern of Anxiety from Social Media Using Interpretable Linguistic Features: A Multi-Faceted Validation Study with Author-Disjoint Evaluation [0.0]
不安は世界中で数億の個人に影響を与えるが、大規模なスクリーニングは依然として限られている。
本研究は,言語的に解釈可能な特徴基底モデリングとドメイン間検証により,ソーシャルメディアに基づく不安検出への透過的なアプローチを示す。
論文 参考訳(メタデータ) (2026-01-16T20:22:34Z) - On the Fallacy of Global Token Perplexity in Spoken Language Model Evaluation [88.77441715819366]
大規模生音声で事前訓練された生成音声言語モデルは、適切な内容で音声プロンプトを継続することができる。
本稿では,グローバルトークンの難易度に代えて,多種多様な可能性・生成的評価手法を提案する。
論文 参考訳(メタデータ) (2026-01-09T22:01:56Z) - Large Language Models as Neurolinguistic Subjects: Discrepancy between Performance and Competence [49.60849499134362]
本研究では,大言語モデル(LLM)の記号化(形式)および記号化(意味)に関する言語的理解について検討する。
ミニマルペアと診断プローブを組み合わせてモデル層間のアクティベーションパターンを解析する新しい手法を用いて,ニューロ言語学的アプローチを提案する。
その結果,(1)心理言語学的・神経言語学的手法では,言語能力と能力が異なっていること,(2)直接確率測定では言語能力が正確に評価されないこと,(3)指導のチューニングでは能力が大きく変化しないが,性能は向上しないことがわかった。
論文 参考訳(メタデータ) (2024-11-12T04:16:44Z) - Comprehending Lexical and Affective Ontologies in the Demographically
Diverse Spatial Social Media Discourse [0.0]
本研究の目的は、英語のスタイル、感情の伝達、ソーシャルメディアデータにおける語彙の多様性など、言語的・社会的なデコグラフィーの特徴を理解することである。
分析では,2つのグループから統計的,文法的,感情的特徴を抽出し,検討する。
両群間の言語特性の相違が明らかとなり,マクロF1スコアは約0.85となった。
論文 参考訳(メタデータ) (2023-11-12T04:23:33Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Evaluating Models of Robust Word Recognition with Serial Reproduction [8.17947290421835]
広範囲確率的生成言語モデルと人間の言語的期待を捉える能力の比較を行った。
先行した言語的文脈の抽象表現を利用するこれらのモデルは、連続再生の過程で人々が行った変化を最もよく予測する。
論文 参考訳(メタデータ) (2021-01-24T20:16:12Z) - Evaluating text coherence based on the graph of the consistency of
phrases to identify symptoms of schizophrenia [0.0]
テキストコヒーレンス推定に基づく統合失調症症状検出の最先端手法について検討した。
文のセマンティック・コヒーレンスと凝集度を評価するために,句の一貫性のグラフに基づく手法が提案されている。
論文 参考訳(メタデータ) (2020-05-06T08:38:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。