論文の概要: Scalable Diffusion Transformer for Conditional 4D fMRI Synthesis
- arxiv url: http://arxiv.org/abs/2511.22870v1
- Date: Fri, 28 Nov 2025 04:18:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.765087
- Title: Scalable Diffusion Transformer for Conditional 4D fMRI Synthesis
- Title(参考訳): 条件付き4次元fMRI合成のためのスケーラブル拡散変換器
- Authors: Jungwoo Seo, David Keetae Park, Shinjae Yoo, Jiook Cha,
- Abstract要約: ボクセルリーな4次元fMRI条件生成のための第1次拡散変換器を提案する。
タスクfMRIでは,タスク駆動のアクティベーションマップを再現し,タスク間表現構造を保存し,完全な条件特異性を実現する。
スケールによって性能が向上し、タスク誘発マップの0.83とRSAの0.98に到達した。
- 参考スコア(独自算出の注目度): 13.638452834334982
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Generating whole-brain 4D fMRI sequences conditioned on cognitive tasks remains challenging due to the high-dimensional, heterogeneous BOLD dynamics across subjects/acquisitions and the lack of neuroscience-grounded validation. We introduce the first diffusion transformer for voxelwise 4D fMRI conditional generation, combining 3D VQ-GAN latent compression with a CNN-Transformer backbone and strong task conditioning via AdaLN-Zero and cross-attention. On HCP task fMRI, our model reproduces task-evoked activation maps, preserves the inter-task representational structure observed in real data (RSA), achieves perfect condition specificity, and aligns ROI time-courses with canonical hemodynamic responses. Performance improves predictably with scale, reaching task-evoked map correlation of 0.83 and RSA of 0.98, consistently surpassing a U-Net baseline on all metrics. By coupling latent diffusion with a scalable backbone and strong conditioning, this work establishes a practical path to conditional 4D fMRI synthesis, paving the way for future applications such as virtual experiments, cross-site harmonization, and principled augmentation for downstream neuroimaging models.
- Abstract(参考訳): 認知タスクで条件付けられた全脳4D fMRI配列の生成は、被験者/取得者間での高次元、異質なBOLDダイナミクスと神経科学に基づく検証の欠如により、依然として困難である。
本稿では,3次元VQ-GAN遅延圧縮とCNN-Transformerバックボーンと,AdaLN-Zeroおよびクロスアテンションによる強いタスク条件付けを組み合わせた,ボクセルワイズ4D fMRI条件生成のための第1次拡散変圧器を提案する。
HCPタスクfMRIでは,タスク誘発活性化マップを再現し,実データ(RSA)で観測されるタスク間表現構造を保存し,完全な条件特異性を実現し,ROI時間軸を標準的血行応答と整合させる。
スケールによって性能が向上し、タスク誘発マップの相関が 0.83 と RSA の 0.98 に達し、U-Net のベースラインを常に上回っている。
この研究は、拡張性のあるバックボーンと強い条件付けとを結合することにより、条件付き4D fMRI合成への実践的な経路を確立し、仮想実験、クロスサイト調和、下流神経画像モデルに対する原理的拡張といった将来の応用への道を開く。
関連論文リスト
- Moving Beyond Diffusion: Hierarchy-to-Hierarchy Autoregression for fMRI-to-Image Reconstruction [65.67001243986981]
我々は,スケールワイド自己回帰モデルに基づく粗大なfMRI画像再構成フレームワークであるMindHierを提案する。
MindHierは、拡散ベースのベースラインよりも優れたセマンティック忠実さ、4.67倍高速な推論、より決定論的結果を達成する。
論文 参考訳(メタデータ) (2025-10-25T15:40:07Z) - Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。
KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文 参考訳(メタデータ) (2025-10-23T07:12:26Z) - NeuroRVQ: Multi-Scale EEG Tokenization for Generative Large Brainwave Models [66.91449452840318]
我々は、コードブックベースのトークン化装置を中心としたスケーラブルな大脳波モデル(LBM)であるNeuroRVQを紹介する。
我々のトークンライザは, (i) フル周波数のニューラルスペクトルを捕捉するマルチスケール特徴抽出モジュール, (ii) 高精細符号化のための階層的残留ベクトル量子化(RVQ)コードブック, (iii) 効率的なトレーニングのためのEEG信号位相および振幅認識損失関数を統合する。
実験の結果,NeuroRVQは再建誤差を低くし,様々な下流タスクにおいて既存のLBMよりも優れることがわかった。
論文 参考訳(メタデータ) (2025-10-15T01:26:52Z) - Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Rest2Visual: Predicting Visually Evoked fMRI from Resting-State Scans [30.743554598059692]
本研究では、静止状態入力と2次元視覚刺激から視覚誘発されたfMRI(ve-fMRI)を予測する条件生成モデルであるRest2Visualを紹介する。
この結果から,自発神経活動の個別化が刺激に適応した表現に変換できることが示唆された。
論文 参考訳(メタデータ) (2025-09-17T01:08:03Z) - SynBrain: Enhancing Visual-to-fMRI Synthesis via Probabilistic Representation Learning [54.390403684665834]
視覚刺激が皮質反応にどのように変換されるかを理解することは、計算神経科学の基本的な課題である。
視覚的意味論から神経反応への変換を確率的かつ生物学的に解釈可能な方法でシミュレートする生成フレームワークであるSynBrainを提案する。
実験結果から,SynBrainは被写体特異的視覚-fMRI符号化性能において最先端の手法を超越していることが示された。
論文 参考訳(メタデータ) (2025-08-14T03:01:05Z) - A Skull-Adaptive Framework for AI-Based 3D Transcranial Focused Ultrasound Simulation [1.662610796043078]
経頭蓋集束超音波(TFUS)は、非侵襲的な脳刺激と治療介入の新たなモダリティである。
TFUScapesは、解剖学的に現実的な人間の頭蓋骨を通して、最初の大規模で高解像度のtFUSシミュレーションデータセットである。
DeepTFUSは、入力された3次元CTボリュームとトランスデューサ位置から直接正規化された圧力場を推定するディープラーニングモデルである。
論文 参考訳(メタデータ) (2025-05-19T11:37:51Z) - X$^{2}$-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction [64.2059940799033]
現在の方法では、時間分解能を呼吸ゲーティング装置で固定相に識別する。
新規なフレームワークであるX$2$-Gaussianは、動的放射スプラッティングと自己監督型呼吸運動学習を統合することで、連続的な4DCT再構成を可能にする。
論文 参考訳(メタデータ) (2025-03-27T17:59:57Z) - fMRI-S4: learning short- and long-range dynamic fMRI dependencies using
1D Convolutions and State Space Models [0.0]
fMRI-S4は、静止状態機能MRIから表現型と精神疾患を分類するための汎用的なディープラーニングモデルである。
我々は,fMRI-S4が3つのタスクすべてにおいて既存の手法よりも優れており,各設定ごとに特別なパラメータ調整を行わずに,プラグ&プレイモデルとして訓練できることを示す。
論文 参考訳(メタデータ) (2022-08-08T14:07:25Z) - Attend and Decode: 4D fMRI Task State Decoding Using Attention Models [2.6954666679827137]
我々は、Brain Attend and Decode (BAnD)と呼ばれる新しいアーキテクチャを提案する。
BAnDは残留畳み込みニューラルネットワークを用いて空間的特徴抽出と時間的モデリングを行う。
我々は,Human Connectome Project-Young Adult データセットの 7-task ベンチマークによる以前の研究と比較して,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2020-04-10T21:29:34Z) - A Hybrid 3DCNN and 3DC-LSTM based model for 4D Spatio-temporal fMRI
data: An ABIDE Autism Classification study [0.0]
本稿では,3次元CNNと3次元磁気LSTMを用いて,全4次元データから特徴を抽出できるエンドツーエンドアルゴリズムを提案する。
提案手法は,NYUサイトとUMサイトにおいて,F1スコア0.78,0.7の単一サイトにおいて,技術結果の状態を達成できることを示す。
論文 参考訳(メタデータ) (2020-02-14T11:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。