論文の概要: BrainVista: Modeling Naturalistic Brain Dynamics as Multimodal Next-Token Prediction
- arxiv url: http://arxiv.org/abs/2602.04512v1
- Date: Wed, 04 Feb 2026 13:00:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.529193
- Title: BrainVista: Modeling Naturalistic Brain Dynamics as Multimodal Next-Token Prediction
- Title(参考訳): BrainVista: マルチモーダル次世代予測として自然な脳のダイナミクスをモデル化する
- Authors: Xuanhua Yin, Runkai Zhao, Lina Yao, Weidong Cai,
- Abstract要約: 脳状態の因果進化をモデル化するためのマルチモーダル自己回帰フレームワークであるBrainVistaを紹介する。
BrainVistaは、ネットワークワイドのトケナイザを組み込んで、システム固有のダイナミクスと、ネットワーク間の情報フローをキャプチャするSpatial Mixer Headを分離する。
我々はAlgonauts 2025, CineBrain, HADのフレームワークを検証し, 最先端のfMRI符号化性能を実現する。
- 参考スコア(独自算出の注目度): 20.44304015989378
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Naturalistic fMRI characterizes the brain as a dynamic predictive engine driven by continuous sensory streams. However, modeling the causal forward evolution in realistic neural simulation is impeded by the timescale mismatch between multimodal inputs and the complex topology of cortical networks. To address these challenges, we introduce BrainVista, a multimodal autoregressive framework designed to model the causal evolution of brain states. BrainVista incorporates Network-wise Tokenizers to disentangle system-specific dynamics and a Spatial Mixer Head that captures inter-network information flow without compromising functional boundaries. Furthermore, we propose a novel Stimulus-to-Brain (S2B) masking mechanism to synchronize high-frequency sensory stimuli with hemodynamically filtered signals, enabling strict, history-only causal conditioning. We validate our framework on Algonauts 2025, CineBrain, and HAD, achieving state-of-the-art fMRI encoding performance. In long-horizon rollout settings, our model yields substantial improvements over baselines, increasing pattern correlation by 36.0\% and 33.3\% on relative to the strongest baseline Algonauts 2025 and CineBrain, respectively.
- Abstract(参考訳): 自然主義的なfMRIは、脳を連続的な感覚の流れによって駆動される動的予測エンジンとして特徴づける。
しかし、現実的な神経シミュレーションにおける因果進化のモデル化は、マルチモーダル入力と皮質ネットワークの複雑なトポロジーの間の時間スケールのミスマッチによって妨げられる。
これらの課題に対処するために、脳状態の因果進化をモデル化するために設計されたマルチモーダル自己回帰フレームワークであるBrainVistaを紹介した。
BrainVistaは、ネットワークワイドのTokenizerを組み込んで、システム固有の力学と、機能境界を損なうことなくネットワーク間情報の流れをキャプチャするSpatial Mixer Headを分離する。
さらに,Stimulus-to-Brain(S2B)マスキング機構を提案する。
我々はAlgonauts 2025, CineBrain, HADのフレームワークを検証し, 最先端のfMRI符号化性能を実現する。
長軸ロールアウト設定では,本モデルでは,最強のAlgonauts 2025とCineBrainと比較して,パターン相関が36.0\%,33.3\%向上した。
関連論文リスト
- BrainFuse: a unified infrastructure integrating realistic biological modeling and core AI methodology [34.597782096704115]
神経科学と人工知能は、一般知性への明確な相補的な経路を表している。
BrainFuseは、バイオ物理ニューラルネットワークと勾配に基づく学習を包括的にサポートする統合インフラストラクチャである。
BrainFuseは、学際的な研究を促進し、次世代のバイオインスパイアされた知能システムの開発を加速するための基礎的なエンジンとして機能する。
論文 参考訳(メタデータ) (2026-01-29T08:44:01Z) - BrainATCL: Adaptive Temporal Brain Connectivity Learning for Functional Link Prediction and Age Estimation [0.33748750222488655]
本稿では、適応的時間的脳接続学習のための非教師なしノンパラメトリックフレームワークBrainATCLを提案する。
提案手法は,新たに追加されたエッジのレートに基づいて,スナップショット毎のルックバックウィンドウを動的に調整する。
グラフシーケンスはGINE-Mamba2バックボーンを用いて符号化され、静止状態fMRIデータにおける動的機能接続の時空間表現を学習する。
論文 参考訳(メタデータ) (2025-08-09T21:18:25Z) - TRIBE: TRImodal Brain Encoder for whole-brain fMRI response prediction [7.864304771129752]
TRIBEは、複数のモードにわたる刺激に対する脳反応を予測するために訓練された最初のディープニューラルネットワークである。
我々のモデルはビデオに対する空間的および時間的fMRI応答を正確にモデル化することができる。
我々のアプローチは、人間の脳における表現の積分モデルを構築するための道を開く。
論文 参考訳(メタデータ) (2025-07-29T20:52:31Z) - Langevin Flows for Modeling Neural Latent Dynamics [81.81271685018284]
逐次変分自動エンコーダであるLangevinFlowを導入し、潜伏変数の時間的進化をアンダーダム化したLangevin方程式で制御する。
われわれのアプローチは、慣性、減衰、学習されたポテンシャル関数、力などの物理的事前を組み込んで、ニューラルネットワークにおける自律的および非自律的プロセスの両方を表現する。
本手法は,ロレンツ誘引器によって生成される合成神経集団に対する最先端のベースラインより優れる。
論文 参考訳(メタデータ) (2025-07-15T17:57:48Z) - Voxel-Level Brain States Prediction Using Swin Transformer [65.9194533414066]
本稿では, 4D Shifted Window (Swin) Transformer をエンコーダとして用い, 時間的情報を効率よく学習し, 畳み込みデコーダを用いて入力fMRIデータと同じ空間的, 時間的解像度で脳状態の予測を可能にするアーキテクチャを提案する。
前回の23.04s fMRI時系列に基づいて7.2sの安静時脳活動を予測すると,高い精度が得られた。
これは、人間の脳の時間的構造が高解像度でSwin Transformerモデルによって学習できることを示す有望な証拠である。
論文 参考訳(メタデータ) (2025-06-13T04:14:38Z) - Spatiotemporal Learning of Brain Dynamics from fMRI Using Frequency-Specific Multi-Band Attention for Cognitive and Psychiatric Applications [5.199807441687141]
MBBN(Multi-Band Net Brain)は、周波数特異的脳波を明示的にモデル化するトランスフォーマーベースのフレームワークである。
MBBNは3つの大規模なコホートで49,673人の個人を訓練し、精神医学と認知学の成果を予測する新しい最先端技術を確立している。
論文 参考訳(メタデータ) (2025-03-30T10:56:50Z) - Artificial Kuramoto Oscillatory Neurons [65.16453738828672]
神経科学とAIの両方では、ニューロン間の'バインディング'が、ネットワークの深い層においてより抽象的な概念を表現するために表現を圧縮する、競争的な学習の形式につながることが知られている。
完全に接続された畳み込みや注意機構などの任意の接続設計とともに人工的再考を導入する。
このアイデアは、教師なしオブジェクト発見、敵対的ロバスト性、不確実性、定量化、推論など、幅広いタスクにわたるパフォーマンス改善を提供する。
論文 参考訳(メタデータ) (2024-10-17T17:47:54Z) - Contrastive Learning in Memristor-based Neuromorphic Systems [55.11642177631929]
スパイクニューラルネットワークは、現代のバックプロパゲーションによって訓練されたディープネットワークに直面する重要な制約の多くを横取りする、ニューロンベースのモデルの重要なファミリーとなっている。
本研究では,前向き・後向き学習のニューロモルフィック形式であるコントラッシブ・シグナル依存型塑性(CSDP)の概念実証を設計し,検討する。
論文 参考訳(メタデータ) (2024-09-17T04:48:45Z) - BrainODE: Dynamic Brain Signal Analysis via Graph-Aided Neural Ordinary Differential Equations [67.79256149583108]
本稿では,脳波を連続的にモデル化するBrainODEというモデルを提案する。
遅延初期値とニューラルODE関数を不規則な時系列から学習することにより、BrainODEは任意の時点の脳信号を効果的に再構築する。
論文 参考訳(メタデータ) (2024-04-30T10:53:30Z) - MindBridge: A Cross-Subject Brain Decoding Framework [60.58552697067837]
脳の復号化は、獲得した脳信号から刺激を再構築することを目的としている。
現在、脳の復号化はモデルごとのオブジェクトごとのパラダイムに限られている。
我々は,1つのモデルのみを用いることで,オブジェクト間脳デコーディングを実現するMindBridgeを提案する。
論文 参考訳(メタデータ) (2024-04-11T15:46:42Z) - Ranking of Communities in Multiplex Spatiotemporal Models of Brain
Dynamics [0.0]
隠れマルコフグラフモデル(HMs)と呼ぶ多重脳状態グラフモデルとして、ニューラルHMMの解釈を提案する。
この解釈により、ネットワーク分析技術の完全なレパートリーを使用して、動的脳活動を分析することができる。
ランダムウォークに基づく手法を用いて,脳領域の重要なコミュニティを決定するための新しいツールを開発した。
論文 参考訳(メタデータ) (2022-03-17T12:14:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。