論文の概要: Toward Automated Cognitive Assessment in Parkinson's Disease Using Pretrained Language Models
- arxiv url: http://arxiv.org/abs/2511.08806v1
- Date: Thu, 13 Nov 2025 01:09:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.233093
- Title: Toward Automated Cognitive Assessment in Parkinson's Disease Using Pretrained Language Models
- Title(参考訳): 事前学習型言語モデルを用いたパーキンソン病の自動認知評価に向けて
- Authors: Varada Khanna, Nilay Bhatt, Ikgyu Shin, Sule Tinaz, Yang Ren, Hua Xu, Vipina K. Keloth,
- Abstract要約: 本研究では,カテゴリを自動的に識別する自然言語処理(NLP)モデルを開発し,評価した。
The three model family, a Bio_ClinicalBERT-based span categorization model for nested entity recognition and a fine-tuned Meta-Llama-3-8B-Instruct model。
微調整されたMeta-Llama-3-8B-Instructは、F1スコア全体(0.74マイクロ平均と0.59マクロ平均)を最高に達成し、特に思考や社会的相互作用といった文脈依存のカテゴリで優れている。
- 参考スコア(独自算出の注目度): 7.799870915134572
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding how individuals with Parkinson's disease (PD) describe cognitive experiences in their daily lives can offer valuable insights into disease-related cognitive and emotional changes. However, extracting such information from unstructured patient narratives is challenging due to the subtle, overlapping nature of cognitive constructs. This study developed and evaluated natural language processing (NLP) models to automatically identify categories that reflect various cognitive processes from de-identified first-person narratives. Three model families, a Bio_ClinicalBERT-based span categorization model for nested entity recognition, a fine-tuned Meta-Llama-3-8B-Instruct model using QLoRA for instruction following, and GPT-4o mini evaluated under zero- and few-shot settings, were compared on their performance on extracting seven categories. Our findings indicated that model performance varied substantially across categories and model families. The fine-tuned Meta-Llama-3-8B-Instruct achieved the highest overall F1-scores (0.74 micro-average and 0.59 macro-average), particularly excelling in context-dependent categories such as thought and social interaction. Bio_ClinicalBERT exhibited high precision but low recall and performed comparable to Llama for some category types such as location and time but failed on other categories such as thought, emotion and social interaction. Compared to conventional information extraction tasks, this task presents a greater challenge due to the abstract and overlapping nature of narrative accounts of complex cognitive processes. Nonetheless, with continued refinement, these NLP systems hold promise for enabling low-burden, longitudinal monitoring of cognitive function and serving as a valuable complement to formal neuropsychological assessments in PD.
- Abstract(参考訳): パーキンソン病(PD)の個人が日常生活における認知経験をどのように表現しているかを理解することは、疾患に関連する認知と感情の変化に対する貴重な洞察を与えることができる。
しかし,非構造的患者の物語からそのような情報を抽出することは,認知的構成要素の微妙で重なり合う性質のため困難である。
本研究では,特定されていない一対一の物語から様々な認知過程を反映したカテゴリを自動的に識別する自然言語処理モデルを開発し,評価した。
3つのモデルファミリー,Bio_ClinicalBERTをベースとしたネステッドエンティティ認識のためのスパン分類モデル,QLoRAを用いた微調整メタラマ-3-8B-インストラクトモデル,ゼロショットおよび少数ショット設定で評価したGPT-4o miniを,それぞれ7つのカテゴリの抽出性能で比較した。
その結果,モデルの性能はカテゴリーやモデルファミリーによって大きく異なっていた。
微調整されたMeta-Llama-3-8B-Instructは、F1スコア全体(0.74マイクロ平均と0.59マクロ平均)を最高に達成し、特に思考や社会的相互作用といった文脈依存のカテゴリで優れている。
Bio_ClinicalBERTは、高精度ながらリコールが低く、位置や時間などのカテゴリタイプではLlamaに匹敵する性能を示したが、思考、感情、社会的相互作用など他のカテゴリでは失敗した。
従来の情報抽出タスクと比較すると,複雑な認知過程の物語的記述が抽象的かつ重複しているため,この課題は大きな課題となる。
にもかかわらず、改良の継続に伴い、これらのNLPシステムは低バーデンで、認知機能の経時的モニタリングを可能にし、PDの形式的な神経心理学的評価を補完する重要な役割を担っている。
関連論文リスト
- Dynamic Programming Techniques for Enhancing Cognitive Representation in Knowledge Tracing [125.75923987618977]
認知表現動的プログラミングに基づく知識追跡(CRDP-KT)モデルを提案する。
質問の難易度とそれらの間の性能間隔に基づいて認知表現を最適化する動的プログラミングアルゴリズムである。
これは、その後のモデルトレーニングのためにより正確で体系的な入力機能を提供し、それによって認知状態のシミュレーションにおける歪みを最小限にする。
論文 参考訳(メタデータ) (2025-06-03T14:44:48Z) - Human Cognitive Benchmarks Reveal Foundational Visual Gaps in MLLMs [65.93003087656754]
VisFactorは、よく確立された認知心理学評価から20の視覚中心のサブテストをデジタル化するベンチマークである。
GPT、Gemini、Claude、LLaMA、Qwen、SEEDファミリーから20のフロンティアマルチモーダル言語モデル(MLLM)を評価する。
最高のパフォーマンスモデルは100点中25.19点のスコアしか得られず、精神的な回転、空間的関係推論、図形の識別といったタスクに一貫して失敗する。
論文 参考訳(メタデータ) (2025-02-23T04:21:32Z) - CognoSpeak: an automatic, remote assessment of early cognitive decline in real-world conversational speech [13.530437810265814]
本稿では,CagnoSpeakとその関連データ収集について述べる。
CognoSpeakは、メモリ提供の長期的および短期的な質問を問うとともに、モバイルまたはWebプラットフォーム上で仮想エージェントを使用して認知タスクを管理する。
オーディオやビデオなどのマルチモーダルデータを収集し、プライマリケアやセカンダリケア、メモリクリニック、人々の家のようなリモート設定から豊富なメタデータを収集する。
論文 参考訳(メタデータ) (2025-01-10T07:13:42Z) - Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [83.15653194899126]
神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
現在のVSNベースのNCD検出法は主にボトムアップ、刺激駆動認知プロセスと密接に結びついている言語マイクロ構造に焦点を当てている。
本稿では,話題の時間的変化を追跡する動的トピックモデル(DTM)と,物語と視覚刺激の相互整合性を測定するテキスト画像時間アライメントネットワーク(TITAN)の2つの新しいマクロ構造手法を提案する。
論文 参考訳(メタデータ) (2025-01-07T12:16:26Z) - Deep State-Space Generative Model For Correlated Time-to-Event Predictions [54.3637600983898]
そこで本研究では,様々な種類の臨床イベント間の相互作用を捉えるために,潜伏状態空間生成モデルを提案する。
また,死亡率と臓器不全の関連性について有意な知見が得られた。
論文 参考訳(メタデータ) (2024-07-28T02:42:36Z) - Evaluating Subjective Cognitive Appraisals of Emotions from Large
Language Models [47.890846082224066]
この研究は、24の評価次元を評価する最も包括的なデータセットであるCovidET-Appraisalsを提示することでギャップを埋める。
CovidET-Appraisalsは、認知的評価を自動的に評価し、説明するための大規模言語モデルの能力を評価するのに理想的なテストベッドを提供する。
論文 参考訳(メタデータ) (2023-10-22T19:12:17Z) - An evaluation of GPT models for phenotype concept recognition [0.4715973318447338]
臨床表現型および表現型アノテーションのためのGPT(Generative Pre-trained Transformer)モデルの性能について検討した。
その結果、適切な設定で、これらのモデルが芸術的パフォーマンスの状態を達成できることが示されている。
論文 参考訳(メタデータ) (2023-09-29T12:06:55Z) - Supervised Learning and Large Language Model Benchmarks on Mental Health Datasets: Cognitive Distortions and Suicidal Risks in Chinese Social Media [23.49883142003182]
中国のソーシャルメディアから,自殺リスク分類のためのSOS-HL-1Kと,認知歪み検出のためのSocialCD-3Kの2つの新しいデータセットを紹介した。
本稿では,2つの教師付き学習手法と8つの大規模言語モデル(LLM)を用いた総合的な評価を提案する。
論文 参考訳(メタデータ) (2023-09-07T08:50:46Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z) - Modeling cognitive load as a self-supervised brain rate with
electroencephalography and deep learning [2.741266294612776]
本研究では,脳波データからメンタルワークロードをモデリングするための,新たな自己教師型手法を提案する。
脳波データからスペクトル地形図を空間的に保存して脳速度変数に適合させることができる畳み込みリカレントニューラルネットワークである。
学習した認知活性化の準安定なブロックの存在は、それらは畳み込みによって誘導され、時間とともに互いに依存していないように見えるため、脳反応の非定常的性質と直感的に一致している。
論文 参考訳(メタデータ) (2022-09-21T07:44:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。