論文の概要: Pretraining Transformer-Based Models on Diffusion-Generated Synthetic Graphs for Alzheimer's Disease Prediction
- arxiv url: http://arxiv.org/abs/2511.20704v1
- Date: Mon, 24 Nov 2025 19:34:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:58.771394
- Title: Pretraining Transformer-Based Models on Diffusion-Generated Synthetic Graphs for Alzheimer's Disease Prediction
- Title(参考訳): アルツハイマー病予知のための拡散生成合成グラフを用いたトランスフォーマーモデルの構築
- Authors: Abolfazl Moslemi, Hossein Peyvandi,
- Abstract要約: 本稿では,合成データ生成とグラフ表現学習と伝達学習を組み合わせたTransformerベースの診断フレームワークを提案する。
実世界のNACCデータセットを用いて、クラス条件付き拡散確率モデル(DDPM)を訓練し、大規模な合成コホートを生成する。
モダリティ固有のグラフトランスフォーマーエンコーダは、まずこの合成データに基づいて、堅牢なクラス識別表現を学習する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early and accurate detection of Alzheimer's disease (AD) is crucial for enabling timely intervention and improving outcomes. However, developing reliable machine learning (ML) models for AD diagnosis is challenging due to limited labeled data, multi-site heterogeneity, and class imbalance. We propose a Transformer-based diagnostic framework that combines diffusion-based synthetic data generation with graph representation learning and transfer learning. A class-conditional denoising diffusion probabilistic model (DDPM) is trained on the real-world NACC dataset to generate a large synthetic cohort that mirrors multimodal clinical and neuroimaging feature distributions while balancing diagnostic classes. Modality-specific Graph Transformer encoders are first pretrained on this synthetic data to learn robust, class-discriminative representations and are then frozen while a neural classifier is trained on embeddings from the original NACC data. We quantify distributional alignment between real and synthetic cohorts using metrics such as Maximum Mean Discrepancy (MMD), Frechet distance, and energy distance, and complement discrimination metrics with calibration and fixed-specificity sensitivity analyses. Empirically, our framework outperforms standard baselines, including early and late fusion deep neural networks and the multimodal graph-based model MaGNet, yielding higher AUC, accuracy, sensitivity, and specificity under subject-wise cross-validation on NACC. These results show that diffusion-based synthetic pretraining with Graph Transformers can improve generalization in low-sample, imbalanced clinical prediction settings.
- Abstract(参考訳): 早期かつ正確なアルツハイマー病(AD)の検出は、タイムリーな介入と結果の改善に不可欠である。
しかし,AD診断のための信頼性機械学習(ML)モデルの開発は,ラベル付きデータやマルチサイト不均一性,クラス不均衡などにより困難である。
本稿では,拡散に基づく合成データ生成とグラフ表現学習と伝達学習を組み合わせたTransformerベースの診断フレームワークを提案する。
実世界のNACCデータセットをベースとしたクラス条件記述拡散確率モデル (DDPM) を訓練し, 診断クラスのバランスを保ちながらマルチモーダルな臨床・神経画像の特徴分布を反映する大規模な合成コホートを生成する。
モダリティ固有のグラフトランスフォーマーエンコーダは、まずこの合成データに基づいて事前訓練され、堅牢なクラス識別表現を学習し、その後、ニューラル分類器が元のNACCデータからの埋め込みを訓練している間に凍結される。
我々は,最大平均離散度 (MMD) , フレシェ距離, エネルギー距離などの指標を用いて, 実数と合成コホート間の分布アライメントを定量化し, キャリブレーションおよび固定特異感度分析による識別指標を補完する。
実験的に、我々のフレームワークは、早期および後期の融合深層ニューラルネットワークやマルチモーダルグラフベースモデルMaGNetなど、標準ベースラインよりも優れており、NACCの主観的クロスバリデーションの下で、より高いAUC、精度、感度、特異性が得られる。
これらの結果から,グラフトランスフォーマーを用いた拡散型合成事前学習は,低サンプル,不均衡な臨床予測設定における一般化を向上できることが示された。
関連論文リスト
- AI-driven Generation of MALDI-TOF MS for Microbial Characterization [1.3155923068686746]
本研究では,MALDI-TOF MSスペクトルを合成するための深層生成モデルについて検討した。
我々は3つの生成モデル、変分オートエンコーダ(MALDIVAEs)、生成共振器ネットワーク(MALDIGANs)、確率モデル(MALDIffusion)を適応・評価する。
実験により、MALDIVAE、MALDIGAN、MALDIffusionによって生成された合成データは、統計的に、診断的に実測値に匹敵することがわかった。
論文 参考訳(メタデータ) (2025-11-18T10:01:21Z) - Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Wearable Sensor-Based IoT XAI Framework for Predicting Freezing of Gait in Parkinsons Disease [0.0]
この研究は、Cataboost、XGBoost、Extra Treesといった機械学習(ML)アルゴリズムを用いて、臨床データに基づく正確なFOG分類を研究する。
開発されたセンサーベースの技術は、医療とバイオメディカルテクノロジーの強化の分野で現実世界の問題解決に大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-07-01T01:22:12Z) - Diffusion with a Linguistic Compass: Steering the Generation of Clinically Plausible Future sMRI Representations for Early MCI Conversion Prediction [13.937881108738042]
そこで本研究では,臨床応用可能な将来のsMRI表現を直接ベースラインデータから合成する拡散型フレームワークを提案する。
ADNIとAIBLのコホートの実験では、MCI-Diffは最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-06-05T07:01:05Z) - Semi-supervised Clustering Through Representation Learning of Large-scale EHR Data [5.591260685112265]
SCOREは、患者埋め込みを通じて多領域の疾患プロファイルをキャプチャする半教師付き表現学習フレームワークである。
大規模データの計算課題に対処するため、ハイブリッド期待最大化(EM)とガウス変分近似(GVA)アルゴリズムを導入している。
分析の結果,ラベル付きデータの導入により精度が向上し,ラベル不足に対する感度が低下することがわかった。
論文 参考訳(メタデータ) (2025-05-27T05:20:17Z) - Development and Comparative Analysis of Machine Learning Models for Hypoxemia Severity Triage in CBRNE Emergency Scenarios Using Physiological and Demographic Data from Medical-Grade Devices [0.0]
グラディエントブースティングモデル(GBM)は、トレーニング速度、解釈可能性、信頼性の点で、シーケンシャルモデルを上回った。
タイムリーな介入のために5分間の予測ウィンドウが選択された。
本研究は、トリアージを改善し、アラーム疲労を軽減するMLの可能性を強調した。
論文 参考訳(メタデータ) (2024-10-30T23:24:28Z) - Assessing Neural Network Representations During Training Using
Noise-Resilient Diffusion Spectral Entropy [55.014926694758195]
ニューラルネットワークにおけるエントロピーと相互情報は、学習プロセスに関する豊富な情報を提供する。
データ幾何を利用して基礎となる多様体にアクセスし、これらの情報理論測度を確実に計算する。
本研究は,高次元シミュレーションデータにおける固有次元と関係強度の耐雑音性の測定結果である。
論文 参考訳(メタデータ) (2023-12-04T01:32:42Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。