論文の概要: Understanding Cross Task Generalization in Handwriting-Based Alzheimer's Screening via Vision Language Adaptation
- arxiv url: http://arxiv.org/abs/2511.05841v1
- Date: Sat, 08 Nov 2025 04:13:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.610241
- Title: Understanding Cross Task Generalization in Handwriting-Based Alzheimer's Screening via Vision Language Adaptation
- Title(参考訳): 視覚言語適応による手書き型アルツハイマースクリーニングにおけるクロスタスク一般化の理解
- Authors: Changqing Gong, Huafeng Qin, Mounim A. El-Yacoubi,
- Abstract要約: アルツハイマー病は神経変性疾患であり、早期発見が重要である。
非侵襲的で費用対効果の高い窓を微妙な運動と認知の低下に導く。
- 参考スコア(独自算出の注目度): 9.89242032529223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Alzheimer's disease is a prevalent neurodegenerative disorder for which early detection is critical. Handwriting-often disrupted in prodromal AD-provides a non-invasive and cost-effective window into subtle motor and cognitive decline. Existing handwriting-based AD studies, mostly relying on online trajectories and hand-crafted features, have not systematically examined how task type influences diagnostic performance and cross-task generalization. Meanwhile, large-scale vision language models have demonstrated remarkable zero or few-shot anomaly detection in natural images and strong adaptability across medical modalities such as chest X-ray and brain MRI. However, handwriting-based disease detection remains largely unexplored within this paradigm. To close this gap, we introduce a lightweight Cross-Layer Fusion Adapter framework that repurposes CLIP for handwriting-based AD screening. CLFA implants multi-level fusion adapters within the visual encoder to progressively align representations toward handwriting-specific medical cues, enabling prompt-free and efficient zero-shot inference. Using this framework, we systematically investigate cross-task generalization-training on a specific handwriting task and evaluating on unseen ones-to reveal which task types and writing patterns most effectively discriminate AD. Extensive analyses further highlight characteristic stroke patterns and task-level factors that contribute to early AD identification, offering both diagnostic insights and a benchmark for handwriting-based cognitive assessment.
- Abstract(参考訳): アルツハイマー病は神経変性疾患であり、早期発見が重要である。
非侵襲的で費用対効果の高い窓を微妙な運動と認知の低下に導く。
既存の手書きAD研究は、主にオンラインの軌跡と手作りの特徴に依存しており、タスクタイプが診断性能やタスク間の一般化にどう影響するかを体系的に検討していない。
一方、大規模視覚言語モデルでは、自然画像において顕著なゼロまたは少数ショットの異常検出が示され、胸部X線や脳MRIなどの医学的適応性が強い。
しかし、手書きによる疾患検出は、このパラダイムの中でほとんど解明されていない。
このギャップを埋めるために、手書きベースのADスクリーニングにCLIPを再利用した軽量なクロスレイアフュージョンアダプタフレームワークを導入する。
CLFAは、視覚エンコーダ内に多層核融合アダプタを埋め込んで、手書き固有の医療的手がかりへの表現を段階的に整列させ、即時かつ効率的なゼロショット推論を可能にする。
本研究では,特定の手書き作業におけるクロスタスクの一般化学習を体系的に検討し,どのタスクタイプや書き込みパターンがADを最も効果的に識別するかを明らかにする。
広範囲な分析により、早期AD識別に寄与する特徴的脳卒中パターンとタスクレベル要因が強調され、診断的洞察と手書きによる認知評価のベンチマークが提供される。
関連論文リスト
- NeuroXVocal: Detection and Explanation of Alzheimer's Disease through Non-invasive Analysis of Picture-prompted Speech [4.815952991777717]
NeuroXVocalは、音声分析によってアルツハイマー病(AD)の可能性を分類し、説明する新しい二重成分システムである。
分類コンポーネント(Neuro)は、音声パターンと音声特徴をキャプチャする音響特徴、音声書き起こしから抽出したテキスト特徴、言語パターンを表す事前計算された埋め込みの3つの異なるデータストリームを処理する。
説明可能性コンポーネント(XVocal)は、大規模言語モデルとAD研究文献のドメイン固有の知識ベースを組み合わせた、検索・拡張生成(RAG)アプローチを実装している。
論文 参考訳(メタデータ) (2025-02-14T12:09:49Z) - Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [83.15653194899126]
神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
現在のVSNベースのNCD検出法は主にボトムアップ、刺激駆動認知プロセスと密接に結びついている言語マイクロ構造に焦点を当てている。
本稿では,話題の時間的変化を追跡する動的トピックモデル(DTM)と,物語と視覚刺激の相互整合性を測定するテキスト画像時間アライメントネットワーク(TITAN)の2つの新しいマクロ構造手法を提案する。
論文 参考訳(メタデータ) (2025-01-07T12:16:26Z) - Devising a Set of Compact and Explainable Spoken Language Feature for Screening Alzheimer's Disease [52.46922921214341]
アルツハイマー病(AD)は高齢化社会において最も重要な健康問題の一つとなっている。
我々は,大言語モデル(LLM)とTF-IDFモデルの視覚的機能を活用する,説明可能な効果的な機能セットを考案した。
当社の新機能は、自動ADスクリーニングの解釈可能性を高めるステップバイステップで説明し、解釈することができる。
論文 参考訳(メタデータ) (2024-11-28T05:23:22Z) - Explainable AI in Handwriting Detection for Dyslexia Using Transfer Learning [0.0]
このフレームワークはトランスファーラーニングとトランスフォーマーベースのモデルを統合し、ディフレキシアに関連する手書きの特徴を識別する。
異なる言語や書記システムへの適応性は、グローバルな適用可能性を示している。
この知見は、早期発見を支援し、ステークホルダ信頼を構築し、パーソナライズされた教育戦略を可能にするフレームワークの能力を強調した。
論文 参考訳(メタデータ) (2024-10-18T11:14:54Z) - On the Within-class Variation Issue in Alzheimer's Disease Detection [66.70233526150723]
Alzheimer's Disease (AD) 検出では、ADと非ADの個人を区別するために、機械学習の分類モデルを使用している。
そこで本研究では,サンプルスコア推定器を用いて,認知的スコアと整合した標本特異的なソフトスコアを生成できることを確認した。
ソフトターゲット蒸留(SoTD)とインスタンスレベルの再分散(InRe)の2つの簡易かつ効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-09-22T02:06:05Z) - Handwriting Anomalies and Learning Disabilities through Recurrent Neural Networks and Geometric Pattern Analysis [0.0]
本研究では、高度な幾何学的パターンとリカレントニューラルネットワーク(RNN)を用いて、失読と失読を示す手書き異常を同定する。
書き起こしはまず標準化され、次にベースラインのずれ、文字の接続性、ストロークの厚さ、その他の異常に焦点を当てた特徴抽出が続く。
最初の結果は、このRNNモデルが、ジストレキシーとジストニアを併用して、最先端の性能を達成する能力を示した。
論文 参考訳(メタデータ) (2024-05-12T10:10:13Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Automated Systems For Diagnosis of Dysgraphia in Children: A Survey and
Novel Framework [2.326866956890798]
学習障害は主に読書、文章、数学などの基本的な学習スキルに干渉し、世界の子供の約10%に影響することが知られている。
神経発達障害としての運動能力の低下と運動調整は、書字の難しさの因果となりうる(図)
失読症の徴候や症状は、不規則な筆跡、筆記媒体の不適切な扱い、遅やかに書き直し、異常な手の位置などに限定されない。
論文 参考訳(メタデータ) (2022-06-27T04:44:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。