論文の概要: Bridging Foundation Models and Efficient Architectures: A Modular Brain Imaging Framework with Local Masking and Pretrained Representation Learning
- arxiv url: http://arxiv.org/abs/2508.16597v1
- Date: Sat, 09 Aug 2025 08:06:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-31 21:54:20.56832
- Title: Bridging Foundation Models and Efficient Architectures: A Modular Brain Imaging Framework with Local Masking and Pretrained Representation Learning
- Title(参考訳): ブリッジング基礎モデルと効率的なアーキテクチャ:局所的なマスキングと事前訓練された表現学習を備えたモジュール型脳イメージングフレームワーク
- Authors: Yanwen Wang, Xinglin Zhao, Yijin Song, Xiaobo Liu, Yanrong Hao, Rui Cao, Xin Wen,
- Abstract要約: ファンデーションモデル(FM)の原則を効率よくドメイン固有のアーキテクチャと統合するモジュラーフレームワークを提案する。
平均絶対誤差は, 年齢予測では5.343, 流体知能では2.940, ピアソン相関係数は0.928, 0.887であった。
この研究は、LLMに基づくfMRI分析のアプローチに代わる堅牢で解釈可能な代替手段を提供し、脳の老化と認知機能に関する新たな洞察を提供する。
- 参考スコア(独自算出の注目度): 7.591083752535149
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Functional connectivity (FC) derived from resting-state fMRI plays a critical role in personalized predictions such as age and cognitive performance. However, applying foundation models(FM) to fMRI data remains challenging due to its high dimensionality, computational complexity, and the difficulty in capturing complex spatiotemporal dynamics and indirect region-of-interest (ROI) interactions. To address these limitations, we propose a modular neuroimaging framework that integrates principles from FM with efficient, domain-specific architectures. Our approach begins with a Local Masked Autoencoder (LMAE) for pretraining, which reduces the influence of hemodynamic response function (HRF) dynamics and suppresses noise. This is followed by a Random Walk Mixture of Experts (RWMOE) module that clusters features across spatial and temporal dimensions, effectively capturing intricate brain interactions. Finally, a state-space model (SSM)-based predictor performs downstream task inference. Evaluated on the Cambridge Centre for Ageing and Neuroscience (Cam-CAN) dataset, our framework achieved mean absolute errors (MAEs) of 5.343 for age prediction and 2.940 for fluid intelligence, with Pearson correlation coefficients (PCCs) of 0.928 and 0.887, respectively-outperforming existing state-of-the-art methods. Visualization of expert distribution weights further enhances interpretability by identifying key brain regions. This work provides a robust, interpretable alternative to LLM-based approaches for fMRI analysis, offering novel insights into brain aging and cognitive function.
- Abstract(参考訳): 静止状態fMRIから導かれる機能的接続(FC)は、年齢や認知能力などのパーソナライズされた予測において重要な役割を果たす。
しかし、fMRIデータに基礎モデル(FM)を適用することは、その高次元性、計算複雑性、複雑な時空間力学と間接的関心領域(ROI)相互作用を捉えることの難しさから、依然として困難である。
これらの制約に対処するために、FMの原理と効率的なドメイン固有アーキテクチャを統合するモジュール型ニューロイメージングフレームワークを提案する。
提案手法は,事前トレーニングのためのローカルマスク付きオートエンコーダ (LMAE) から始まり,血行力学的応答関数 (HRF) の影響を低減し,ノイズを抑制する。
続いてRandom Walk Mixture of Experts(RWMOE)モジュールが、空間的および時間的次元にまたがる特徴をクラスタリングし、複雑な脳の相互作用を効果的に捉える。
最後に、状態空間モデル(SSM)ベースの予測器が下流のタスク推論を実行する。
ケンブリッジ・センター・フォー・エイジング・アンド・ニューロサイエンス(Cam-CAN)データセットを用いて, 年齢予測では平均絶対誤差(MAE)が5.343, 流体知能では2.940, ピアソン相関係数(PCC)が0.928, 0.887, 既存の最先端手法では0.887であった。
専門的な分布重みの可視化は、主要な脳領域を識別することによって解釈可能性をさらに向上させる。
この研究は、LLMに基づくfMRI分析のアプローチに代わる堅牢で解釈可能な代替手段を提供し、脳の老化と認知機能に関する新たな洞察を提供する。
関連論文リスト
- Foundation Model for Skeleton-Based Human Action Understanding [56.89025287217221]
本稿では,統一骨格に基づくDense Representation Learningフレームワークを提案する。
USDRLはトランスフォーマーベースのDense Spatio-Temporal (DSTE)、Multi-Grained Feature Deorrelation (MG-FD)、Multi-Perspective Consistency Training (MPCT)で構成されている。
論文 参考訳(メタデータ) (2025-08-18T02:42:16Z) - Predicting Cognition from fMRI:A Comparative Study of Graph, Transformer, and Kernel Models Across Task and Rest Conditions [1.0832932170181544]
本研究は,認知予測のための古典的機械学習(KRR)と高度ディープラーニング(DL)モデルを体系的にベンチマークした。
その結果,認知に直結したニューラル応答を誘発するタスクベースfMRIは,認知行動予測におけるRSfMRIよりも優れていた。
論文 参考訳(メタデータ) (2025-07-28T17:29:22Z) - BrainMT: A Hybrid Mamba-Transformer Architecture for Modeling Long-Range Dependencies in Functional MRI Data [0.09363323206192666]
近年のディープラーニングの進歩により、機能的磁気共鳴画像(fMRI)脳の体積から直接表現型測定を予測できるようになった。
本稿では,fMRIデータの長距離時間特性を効率的に学習し,統合するための新しいハイブリッドフレームワークBrainMTを紹介する。
筆者らのフレームワークは,(1)時間優先走査機構を備えた双方向マンバブロックを用いて,時間的に効率よくグローバルな時間的相互作用をキャプチャし,(2)グローバルな空間的関係をモデル化するための自己認識を利用したトランスフォーマーブロックの2段階で動作する。
論文 参考訳(メタデータ) (2025-06-27T19:20:41Z) - Towards a general-purpose foundation model for fMRI analysis [58.06455456423138]
我々は,4次元fMRIボリュームから学習し,多様なアプリケーション間で効率的な知識伝達を可能にするフレームワークであるNeuroSTORMを紹介する。
NeuroSTORMは、複数のセンターにまたがる5万人以上の被験者から5歳から100歳までの28.65万fMRIフレーム(→9000時間)で事前トレーニングされている。
年齢/性別予測、表現型予測、疾患診断、fMRI-to-image検索、タスクベースのfMRIの5つのタスクにおいて、既存の手法よりも優れています。
論文 参考訳(メタデータ) (2025-06-11T23:51:01Z) - BrainMAE: A Region-aware Self-supervised Learning Framework for Brain Signals [11.030708270737964]
本稿では,fMRI時系列データから直接表現を学習するBrain Masked Auto-Encoder(BrainMAE)を提案する。
BrainMAEは、4つの異なる下流タスクにおいて、確立されたベースラインメソッドをかなりのマージンで一貫して上回っている。
論文 参考訳(メタデータ) (2024-06-24T19:16:24Z) - Interpretable Spatio-Temporal Embedding for Brain Structural-Effective Network with Ordinary Differential Equation [56.34634121544929]
本研究では,まず動的因果モデルを用いて脳効果ネットワークを構築する。
次に、STE-ODE(Spatio-Temporal Embedding ODE)と呼ばれる解釈可能なグラフ学習フレームワークを導入する。
このフレームワークは、構造的および効果的なネットワーク間の動的相互作用を捉えることを目的とした、特異的に設計されたノード埋め込み層を含んでいる。
論文 参考訳(メタデータ) (2024-05-21T20:37:07Z) - DSAM: A Deep Learning Framework for Analyzing Temporal and Spatial Dynamics in Brain Networks [4.041732967881764]
ほとんどのrs-fMRI研究は、関心のある脳領域にまたがる単一の静的機能接続行列を計算している。
これらのアプローチは、脳のダイナミクスを単純化し、目の前のゴールを適切に考慮していないリスクがある。
本稿では,時系列から直接ゴール固有の機能的接続行列を学習する,解釈可能な新しいディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-19T23:35:06Z) - fMRI-PTE: A Large-scale fMRI Pretrained Transformer Encoder for
Multi-Subject Brain Activity Decoding [54.17776744076334]
本稿では,fMRI事前学習のための革新的オートエンコーダであるfMRI-PTEを提案する。
我々のアプローチでは、fMRI信号を統合された2次元表現に変換し、次元の整合性を確保し、脳の活動パターンを保存する。
コントリビューションには、fMRI-PTEの導入、革新的なデータ変換、効率的なトレーニング、新しい学習戦略、そして我々のアプローチの普遍的な適用性が含まれる。
論文 参考訳(メタデータ) (2023-11-01T07:24:22Z) - fMRI from EEG is only Deep Learning away: the use of interpretable DL to
unravel EEG-fMRI relationships [68.8204255655161]
多チャンネル脳波データからいくつかの皮質下領域の活性を回復するための解釈可能な領域基底解を提案する。
我々は,皮質下核の血行動態信号の頭皮脳波予測の空間的・時間的パターンを復元する。
論文 参考訳(メタデータ) (2022-10-23T15:11:37Z) - Influence Estimation and Maximization via Neural Mean-Field Dynamics [60.91291234832546]
本稿では,ニューラル平均場(NMF)ダイナミクスを用いた新しい学習フレームワークを提案する。
我々のフレームワークは拡散ネットワークの構造とノード感染確率の進化を同時に学習することができる。
論文 参考訳(メタデータ) (2021-06-03T00:02:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。