論文の概要: BrainMT: A Hybrid Mamba-Transformer Architecture for Modeling Long-Range Dependencies in Functional MRI Data
- arxiv url: http://arxiv.org/abs/2506.22591v1
- Date: Fri, 27 Jun 2025 19:20:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.476396
- Title: BrainMT: A Hybrid Mamba-Transformer Architecture for Modeling Long-Range Dependencies in Functional MRI Data
- Title(参考訳): BrainMT: 機能的MRIデータの長距離依存性をモデル化するためのハイブリッドマンバ変換器アーキテクチャ
- Authors: Arunkumar Kannan, Martin A. Lindquist, Brian Caffo,
- Abstract要約: 近年のディープラーニングの進歩により、機能的磁気共鳴画像(fMRI)脳の体積から直接表現型測定を予測できるようになった。
本稿では,fMRIデータの長距離時間特性を効率的に学習し,統合するための新しいハイブリッドフレームワークBrainMTを紹介する。
筆者らのフレームワークは,(1)時間優先走査機構を備えた双方向マンバブロックを用いて,時間的に効率よくグローバルな時間的相互作用をキャプチャし,(2)グローバルな空間的関係をモデル化するための自己認識を利用したトランスフォーマーブロックの2段階で動作する。
- 参考スコア(独自算出の注目度): 0.09363323206192666
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in deep learning have made it possible to predict phenotypic measures directly from functional magnetic resonance imaging (fMRI) brain volumes, sparking significant interest in the neuroimaging community. However, existing approaches, primarily based on convolutional neural networks or transformer architectures, often struggle to model the complex relationships inherent in fMRI data, limited by their inability to capture long-range spatial and temporal dependencies. To overcome these shortcomings, we introduce BrainMT, a novel hybrid framework designed to efficiently learn and integrate long-range spatiotemporal attributes in fMRI data. Our framework operates in two stages: (1) a bidirectional Mamba block with a temporal-first scanning mechanism to capture global temporal interactions in a computationally efficient manner; and (2) a transformer block leveraging self-attention to model global spatial relationships across the deep features processed by the Mamba block. Extensive experiments on two large-scale public datasets, UKBioBank and the Human Connectome Project, demonstrate that BrainMT achieves state-of-the-art performance on both classification (sex prediction) and regression (cognitive intelligence prediction) tasks, outperforming existing methods by a significant margin. Our code and implementation details will be made publicly available at this https://github.com/arunkumar-kannan/BrainMT-fMRI
- Abstract(参考訳): 近年のディープラーニングの進歩により、機能的磁気共鳴画像(fMRI)脳の体積から直接表現型測定を予測できるようになった。
しかし、畳み込みニューラルネットワークやトランスフォーマーアーキテクチャに基づく既存のアプローチは、しばしばfMRIデータに固有の複雑な関係をモデル化するのに苦労する。
このような欠点を克服するために,fMRIデータ中の長距離時空間特性を効率的に学習し,統合する新しいハイブリッドフレームワークBrainMTを導入する。
筆者らのフレームワークは,(1)時間優先走査機構を備えた双方向マンバブロックを用いて,時間的に効率よくグローバルな時間的相互作用を捉えること,(2)マンバブロックによって処理される深い特徴をまたいだグローバルな空間的関係をモデル化するために自己アテンションを利用するトランスフォーマーブロックの2段階で動作する。
UKBioBankとHuman Connectome Projectの2つの大規模な公開データセットに関する大規模な実験は、BrainMTが、分類(性予測)と回帰(認知知性予測)の両方のタスクにおいて最先端のパフォーマンスを達成し、既存の手法を著しく上回っていることを実証している。
私たちのコードと実装の詳細は、https://github.com/arunkumar-kannan/BrainMT-fMRIで公開されます。
関連論文リスト
- BrainSymphony: A Transformer-Driven Fusion of fMRI Time Series and Structural Connectivity [2.3486335708866606]
BrainSymphonyは、ニューロイメージングのための軽量でパラメータ効率の良い基礎モデルである。
かなり小さなパブリックデータセットで事前トレーニングされた状態で、最先端のパフォーマンスを実現する。
BrainSymphonyは、アーキテクチャを意識したマルチモーダルモデルがより大きなモデルを上回る可能性があることを証明している。
論文 参考訳(メタデータ) (2025-06-23T06:00:21Z) - Voxel-Level Brain States Prediction Using Swin Transformer [65.9194533414066]
本稿では, 4D Shifted Window (Swin) Transformer をエンコーダとして用い, 時間的情報を効率よく学習し, 畳み込みデコーダを用いて入力fMRIデータと同じ空間的, 時間的解像度で脳状態の予測を可能にするアーキテクチャを提案する。
前回の23.04s fMRI時系列に基づいて7.2sの安静時脳活動を予測すると,高い精度が得られた。
これは、人間の脳の時間的構造が高解像度でSwin Transformerモデルによって学習できることを示す有望な証拠である。
論文 参考訳(メタデータ) (2025-06-13T04:14:38Z) - Classification of Mild Cognitive Impairment Based on Dynamic Functional Connectivity Using Spatio-Temporal Transformer [30.044545011553172]
本稿では,dFC内における空間情報と時間情報の両方の埋め込みを共同で学習する新しい枠組みを提案する。
アルツハイマー病神経画像イニシアチブ(ADNI)から570回のスキャンを行った345名の被験者を対象に,提案手法の優位性を実証した。
論文 参考訳(メタデータ) (2025-01-27T18:20:33Z) - Hierarchical Spatio-Temporal State-Space Modeling for fMRI Analysis [1.89314691075208]
実験結果から,脳の分類と回帰作業におけるFST-Mambaモデルの有効性が示唆された。
我々の研究は、脳発見における注意のないシーケンスモデリングの可能性を明らかにしている。
論文 参考訳(メタデータ) (2024-08-23T13:58:14Z) - BrainMAE: A Region-aware Self-supervised Learning Framework for Brain Signals [11.030708270737964]
本稿では,fMRI時系列データから直接表現を学習するBrain Masked Auto-Encoder(BrainMAE)を提案する。
BrainMAEは、4つの異なる下流タスクにおいて、確立されたベースラインメソッドをかなりのマージンで一貫して上回っている。
論文 参考訳(メタデータ) (2024-06-24T19:16:24Z) - MindFormer: Semantic Alignment of Multi-Subject fMRI for Brain Decoding [50.55024115943266]
本稿では,MindFormer を用いたマルチオブジェクト fMRI 信号のセマンティックアライメント手法を提案する。
このモデルは、fMRIから画像生成のための安定拡散モデルや、fMRIからテキスト生成のための大規模言語モデル(LLM)の条件付けに使用できるfMRI条件付き特徴ベクトルを生成するように設計されている。
実験の結果,MindFormerは意味的に一貫した画像とテキストを異なる主題にわたって生成することがわかった。
論文 参考訳(メタデータ) (2024-05-28T00:36:25Z) - Interpretable Spatio-Temporal Embedding for Brain Structural-Effective Network with Ordinary Differential Equation [56.34634121544929]
本研究では,まず動的因果モデルを用いて脳効果ネットワークを構築する。
次に、STE-ODE(Spatio-Temporal Embedding ODE)と呼ばれる解釈可能なグラフ学習フレームワークを導入する。
このフレームワークは、構造的および効果的なネットワーク間の動的相互作用を捉えることを目的とした、特異的に設計されたノード埋め込み層を含んでいる。
論文 参考訳(メタデータ) (2024-05-21T20:37:07Z) - MindBridge: A Cross-Subject Brain Decoding Framework [60.58552697067837]
脳の復号化は、獲得した脳信号から刺激を再構築することを目的としている。
現在、脳の復号化はモデルごとのオブジェクトごとのパラダイムに限られている。
我々は,1つのモデルのみを用いることで,オブジェクト間脳デコーディングを実現するMindBridgeを提案する。
論文 参考訳(メタデータ) (2024-04-11T15:46:42Z) - Predicting Infant Brain Connectivity with Federated Multi-Trajectory
GNNs using Scarce Data [54.55126643084341]
既存のディープラーニングソリューションには,3つの大きな制限がある。
我々はフェデレートグラフベースの多軌道進化ネットワークであるFedGmTE-Net++を紹介する。
フェデレーションの力を利用して、限られたデータセットを持つ多種多様な病院の地域学習を集約する。
論文 参考訳(メタデータ) (2024-01-01T10:20:01Z) - The Expressive Leaky Memory Neuron: an Efficient and Expressive Phenomenological Neuron Model Can Solve Long-Horizon Tasks [64.08042492426992]
本稿では,脳皮質ニューロンの生物学的モデルであるExpressive Memory(ELM)ニューロンモデルを紹介する。
ELMニューロンは、上記の入力-出力関係を1万以下のトレーニング可能なパラメータと正確に一致させることができる。
本稿では,Long Range Arena(LRA)データセットなど,時間構造を必要とするタスクで評価する。
論文 参考訳(メタデータ) (2023-06-14T13:34:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。