論文の概要: Hybrid Transformer for Early Alzheimer's Detection: Integration of Handwriting-Based 2D Images and 1D Signal Features
- arxiv url: http://arxiv.org/abs/2410.10547v1
- Date: Mon, 14 Oct 2024 14:26:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-29 20:55:06.307480
- Title: Hybrid Transformer for Early Alzheimer's Detection: Integration of Handwriting-Based 2D Images and 1D Signal Features
- Title(参考訳): アルツハイマー早期発見のためのハイブリッドトランス:手書き2次元画像と1次元信号機能の統合
- Authors: Changqing Gong, Huafeng Qin, Mounîm A. El-Yacoubi,
- Abstract要約: アルツハイマー病(英語: Alzheimer's Disease、AD)は、早期発見が不可欠である神経変性疾患である。
ADの初期にしばしば影響を受ける手書き文字は、微妙な運動の変化を捉える非侵襲的でコスト効率のよい方法を提供する。
2次元手書き画像と1次元動的手書き信号を同時に統合した学習可能なマルチモーダルハイブリッドアテンションモデルを提案する。
F1スコア90.32%、タスク8では90.91%の精度でDARWINデータセット上での最先端性能を実現した('L'書き込み)。
- 参考スコア(独自算出の注目度): 2.606124959056959
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Alzheimer's Disease (AD) is a prevalent neurodegenerative condition where early detection is vital. Handwriting, often affected early in AD, offers a non-invasive and cost-effective way to capture subtle motor changes. State-of-the-art research on handwriting, mostly online, based AD detection has predominantly relied on manually extracted features, fed as input to shallow machine learning models. Some recent works have proposed deep learning (DL)-based models, either 1D-CNN or 2D-CNN architectures, with performance comparing favorably to handcrafted schemes. These approaches, however, overlook the intrinsic relationship between the 2D spatial patterns of handwriting strokes and their 1D dynamic characteristics, thus limiting their capacity to capture the multimodal nature of handwriting data. Moreover, the application of Transformer models remains basically unexplored. To address these limitations, we propose a novel approach for AD detection, consisting of a learnable multimodal hybrid attention model that integrates simultaneously 2D handwriting images with 1D dynamic handwriting signals. Our model leverages a gated mechanism to combine similarity and difference attention, blending the two modalities and learning robust features by incorporating information at different scales. Our model achieved state-of-the-art performance on the DARWIN dataset, with an F1-score of 90.32\% and accuracy of 90.91\% in Task 8 ('L' writing), surpassing the previous best by 4.61% and 6.06% respectively.
- Abstract(参考訳): アルツハイマー病(英語: Alzheimer's Disease、AD)は、早期発見が不可欠である神経変性疾患である。
ADの初期にしばしば影響を受ける手書き文字は、微妙な運動の変化を捉える非侵襲的でコスト効率のよい方法を提供する。
主にオンラインベースの手書き文字によるAD検出に関する最先端の研究は、手作業で抽出した機能に大きく依存しており、浅い機械学習モデルへの入力として提供されている。
近年の研究では、1D-CNNアーキテクチャや2D-CNNアーキテクチャなど、ディープラーニング(DL)ベースのモデルが提案されている。
しかし、これらの手法は、手書きストロークの2次元空間パターンとその1次元動的特性との本質的な関係を軽視し、手書きデータのマルチモーダルな性質を捉える能力を制限する。
さらに、Transformerモデルの適用は、基本的には未検討のままである。
このような制約に対処するために,2次元手書き画像と1次元動的手書き信号とを同時に統合した学習可能なマルチモーダルハイブリッドアテンションモデルによるAD検出手法を提案する。
本モデルでは,類似点と相違点を組み合わせ,2つのモードをブレンドし,異なるスケールの情報を組み込むことでロバストな特徴を学習するために,ゲート機構を利用する。
我々のモデルはDARWINデータセットの最先端性能を達成し、F1スコアは90.32\%、精度は90.91\%であり、それぞれ4.61%と6.06%を上回った。
関連論文リスト
- Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - 1D-Convolutional transformer for Parkinson disease diagnosis from gait [7.213855322671065]
本稿では,歩行からパーキンソン病の診断に有効なディープニューラルネットワークモデルを提案する。
本稿では,重症度を検知し,病状を正確に診断するためのハイブリッドConvNetTransform-erアーキテクチャを提案する。
提案手法は歩行データからパーキンソン病の異なる段階を検出するのに有効であることが示された。
論文 参考訳(メタデータ) (2023-11-06T15:17:17Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Context-aware attention layers coupled with optimal transport domain
adaptation and multimodal fusion methods for recognizing dementia from
spontaneous speech [0.0]
アルツハイマー病(英語: Alzheimer's disease、AD)は、認知症の主要な原因である複雑な神経認知疾患である。
そこで本研究では,AD患者検出のための新しい手法を提案する。
ADReSSとADReSSo Challengeで実施した実験は、既存の研究イニシアチブに対して導入したアプローチの有効性を示している。
論文 参考訳(メタデータ) (2023-05-25T18:18:09Z) - Adapting the Mean Teacher for keypoint-based lung registration under
geometric domain shifts [75.51482952586773]
ディープニューラルネットワークは一般的に、ラベル付きトレーニングデータが多く必要であり、トレーニングデータとテストデータの間のドメインシフトに弱い。
本稿では,ラベル付きソースからラベル付きターゲットドメインへのモデルの適用により,画像登録のための幾何学的領域適応手法を提案する。
本手法は,ベースラインモデルの精度を目標データに適合させながら,ベースラインモデルの50%/47%を継続的に改善する。
論文 参考訳(メタデータ) (2022-07-01T12:16:42Z) - Multi-Modal Hypergraph Diffusion Network with Dual Prior for Alzheimer
Classification [4.179845212740817]
アルツハイマー病診断のための新しい半教師付きハイパーグラフ学習フレームワークを提案する。
本フレームワークは,マルチモーダル画像と非画像データ間の高次関係を実現する。
我々は、我々の実験を通して、我々のフレームワークがアルツハイマー病診断の現在の技術より優れていることを実証した。
論文 参考訳(メタデータ) (2022-04-04T10:31:42Z) - Voxelmorph++ Going beyond the cranial vault with keypoint supervision
and multi-channel instance optimisation [8.88841928746097]
近年のLearn2Regベンチマークでは,単スケールU-Netアーキテクチャーは腹部または患者内肺登録の最先端性能に劣っている。
本稿では、この精度のギャップを大幅に減らすための2つの簡単な手順を提案する。
まず、離散化されたヒートマップを予測する新しいネットワークヘッドを備えたキーポイント・セルフスーパービジョンを用いる。
次に、複数の学習した微調整ステップを、手作りの機能とAdamオプティマイザでひとつのインスタンスに置き換える。
論文 参考訳(メタデータ) (2022-02-28T19:23:29Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Sequence-based Dynamic Handwriting Analysis for Parkinson's Disease
Detection with One-dimensional Convolutions and BiGRUs [5.936804438746453]
パーキンソン病(PD)は、ブラジキネシアアキネシア、剛性、震えなどのいくつかの運動症状を特徴とする。
患者の運動制御、特に手書き動作の分析は、PDアセスメントを支援する強力なツールである。
本論文では,一方向畳み込みとBiGated Recurrent Units (GRUs)に基づく新しい分類モデルを提案する。
論文 参考訳(メタデータ) (2021-01-23T09:25:13Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。