論文の概要: Deep Learning in Mild Cognitive Impairment Diagnosis using Eye Movements and Image Content in Visual Memory Tasks
- arxiv url: http://arxiv.org/abs/2506.23016v1
- Date: Sat, 28 Jun 2025 21:20:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.670049
- Title: Deep Learning in Mild Cognitive Impairment Diagnosis using Eye Movements and Image Content in Visual Memory Tasks
- Title(参考訳): 視覚記憶課題における眼球運動と画像量を用いた軽度認知障害診断の深層学習
- Authors: Tomás Silva Santos Rocha, Anastasiia Mikhailova, Moreno I. Coco, José Santos-Victor,
- Abstract要約: 本研究は、視線追跡データを用いたデジタル認知タスクを用いて、健康管理(HC)とマイルド認知障害(MCI)を区別する。
44名の被験者の視線追跡データを用いて,VTNetに基づくディープラーニングモデルを訓練した。
モデルの性能は、同様の方法を用いたアルツハイマーの研究に匹敵する。
- 参考スコア(独自算出の注目度): 4.497154890758607
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The global prevalence of dementia is projected to double by 2050, highlighting the urgent need for scalable diagnostic tools. This study utilizes digital cognitive tasks with eye-tracking data correlated with memory processes to distinguish between Healthy Controls (HC) and Mild Cognitive Impairment (MCI), a precursor to dementia. A deep learning model based on VTNet was trained using eye-tracking data from 44 participants (24 MCI, 20 HCs) who performed a visual memory task. The model utilizes both time series and spatial data derived from eye-tracking. It was modified to incorporate scan paths, heat maps, and image content. These modifications also enabled testing parameters such as image resolution and task performance, analyzing their impact on model performance. The best model, utilizing $700\times700px$ resolution heatmaps, achieved 68% sensitivity and 76% specificity. Despite operating under more challenging conditions (e.g., smaller dataset size, shorter task duration, or a less standardized task), the model's performance is comparable to an Alzheimer's study using similar methods (70% sensitivity and 73% specificity). These findings contribute to the development of automated diagnostic tools for MCI. Future work should focus on refining the model and using a standardized long-term visual memory task.
- Abstract(参考訳): 認知症の世界的な流行は2050年までに2倍になると予測されており、スケーラブルな診断ツールの緊急性の必要性を強調している。
本研究は,認知症の前駆者である健康管理(HC)とマイルド認知障害(MCI)を区別するために,記憶過程と相関した視線追跡データを用いたデジタル認知タスクを利用する。
VTNetに基づくディープラーニングモデルは、視覚記憶タスクを実行した44人の参加者(24MCI、20HCs)の視線追跡データを用いて訓練された。
このモデルは、視線追跡から得られた時系列データと空間データの両方を利用する。
スキャンパス、ヒートマップ、画像の内容を含むように修正された。
これらの修正により、画像の解像度やタスクパフォーマンスなどのテストパラメータも可能となり、モデルパフォーマンスへの影響を分析した。
最高のモデルは700\times700px$解像度のヒートマップを使い、68%の感度と76%の特異性を実現した。
より困難な条件(例えば、データセットのサイズが小さくなり、タスク時間が短くなり、より少ないタスク)の下で運用されているにもかかわらず、モデルの性能は、同様の方法(70%の感度と73%の特異性)を用いたアルツハイマー研究に匹敵する。
これらの知見は、MCIのための自動診断ツールの開発に寄与する。
今後の作業は、モデルを洗練し、標準化された長期視覚記憶タスクを使用することに集中する必要がある。
関連論文リスト
- Towards Better Cephalometric Landmark Detection with Diffusion Data Generation [43.381003080365254]
本研究では,人間の介入を伴わない,多様な頭部X線画像とそれに対応するアノテーションを生成できる革新的なデータ生成手法を開発した。
詳細なプロンプトを活用することで,異なるスタイルや属性を制御できるように生成プロセスを改善する。
生成したデータを使用しない手法と比較して,SDR(Success Detection Rate)が6.5%向上し,82.2%が顕著となった。
論文 参考訳(メタデータ) (2025-05-09T13:50:27Z) - Task-Specific Knowledge Distillation from the Vision Foundation Model for Enhanced Medical Image Segmentation [13.018234326432964]
医用画像セグメンテーションのための新規で汎用的なタスク固有知識蒸留フレームワークを提案する。
提案手法は,目標セグメンテーションタスクのVFMを微調整し,より小さなモデルに知識を蒸留する前にタスク固有の特徴を抽出する。
5つの医用画像データセットに対する実験結果から,本手法はタスク非依存の知識蒸留より一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-03-10T06:39:53Z) - LVS-Net: A Lightweight Vessels Segmentation Network for Retinal Image Analysis [1.347667211255822]
本稿では,網膜血管を分割して疾患検出効率を向上させる軽量エンコーダデコーダモデルを提案する。
エンコーダにマルチスケールの畳み込みブロックを組み込んで、様々な大きさと厚さの容器を正確に識別する。
ダイススコアが86.44%、84.22%、87.88%の既存モデルを上回っている。
論文 参考訳(メタデータ) (2024-12-08T15:21:37Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Scaling Wearable Foundation Models [54.93979158708164]
センサ基礎モデルのスケーリング特性を計算,データ,モデルサイズにわたって検討する。
最大4000万時間分の心拍数、心拍変動、心電図活動、加速度計、皮膚温度、および1分間のデータを用いて、私たちはLSMを作成します。
この結果から,LSMのスケーリング法則は,時間とセンサの両面において,計算や外挿などのタスクに対して確立されている。
論文 参考訳(メタデータ) (2024-10-17T15:08:21Z) - Hybridized Convolutional Neural Networks and Long Short-Term Memory for
Improved Alzheimer's Disease Diagnosis from MRI Scans [2.621434923709917]
本研究では,CNNモデルの特徴抽出機能とLSTMモデルの検出機能を組み合わせたハイブリッドモデルを提案する。
ADNIデータセットを利用したハイブリッドモデルのトレーニング。
モデルの精度は98.8%、感度は100%、特異度は76%に達した。
論文 参考訳(メタデータ) (2024-03-08T14:34:32Z) - USIM-DAL: Uncertainty-aware Statistical Image Modeling-based Dense
Active Learning for Super-resolution [47.38982697349244]
デンス回帰(Dense regression)は、画像の超解像、エンハンスメント、深さ推定などのタスクのためのコンピュータビジョンで広く使われているアプローチである。
この問題に対処するために,能動学習を高密度回帰モデルに組み込むことを提案する。
アクティブな学習により、モデルはラベル付けのための最も有益なサンプルを選択し、全体的なアノテーションコストを削減し、パフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2023-05-27T16:33:43Z) - Efficiently Training Vision Transformers on Structural MRI Scans for
Alzheimer's Disease Detection [2.359557447960552]
ビジョントランスフォーマー(ViT)は近年、コンピュータビジョンアプリケーションのためのCNNの代替として登場した。
難易度に基づいて,脳神経画像の下流タスクに対するViTアーキテクチャの変種を検証した。
合成および実MRIスキャンで事前訓練した微調整型視覚変換器モデルを用いて、5%と9-10%の性能向上を実現した。
論文 参考訳(メタデータ) (2023-03-14T20:18:12Z) - Could Giant Pretrained Image Models Extract Universal Representations? [94.97056702288317]
本稿では,多種多様なコンピュータビジョンタスクに適用した凍結事前学習モデルについて述べる。
私たちの研究は、この凍結した設定にどのような事前学習タスクが最適か、凍結した設定を様々な下流タスクに柔軟にする方法、より大きなモデルサイズの影響について、質問に答えています。
論文 参考訳(メタデータ) (2022-11-03T17:57:10Z) - Classification of Alzheimer's Disease Using the Convolutional Neural
Network (CNN) with Transfer Learning and Weighted Loss [2.191505742658975]
本研究では,Residual Network 18 Layer(ResNet-18)アーキテクチャを用いた畳み込みニューラルネットワーク(CNN)手法を提案する。
モデルの精度は、転送学習、重み付き損失、およびミッシュアクティベーション関数を用いて88.3%である。
論文 参考訳(メタデータ) (2022-07-04T17:09:27Z) - HM4: Hidden Markov Model with Memory Management for Visual Place
Recognition [54.051025148533554]
自律運転における視覚的位置認識のための隠れマルコフモデルを提案する。
我々のアルゴリズムはHM$4$と呼ばれ、時間的ルックアヘッドを利用して、有望な候補画像をパッシブストレージとアクティブメモリ間で転送する。
固定被覆領域に対して一定の時間と空間推定が可能であることを示す。
論文 参考訳(メタデータ) (2020-11-01T08:49:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。