論文の概要: Duala: Dual-Level Alignment of Subjects and Stimuli for Cross-Subject fMRI Decoding
- arxiv url: http://arxiv.org/abs/2603.07625v1
- Date: Sun, 08 Mar 2026 13:22:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.986388
- Title: Duala: Dual-Level Alignment of Subjects and Stimuli for Cross-Subject fMRI Decoding
- Title(参考訳): Duala: クロスオブジェクトfMRIデコードのための被験者と刺激のデュアルレベルアライメント
- Authors: Shumeng Li, Jintao Guo, Jian Zhang, Yulin Zhou, Luyang Cao, Yinghuan Shi,
- Abstract要約: クロスオブジェクト視覚デコーディングは、個人間での脳活動からの視覚体験を再構築することを目的としている。
既存の手法は、データ制限のある新しい被験者に適応する際に、しばしば劣化したパフォーマンスに悩まされる。
刺激レベルの整合性と主観レベルの整合性を実現するために設計された二重レベル整合性フレームワークであるDualaを提案する。
- 参考スコア(独自算出の注目度): 37.36610841961446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-subject visual decoding aims to reconstruct visual experiences from brain activity across individuals, enabling more scalable and practical brain-computer interfaces. However, existing methods often suffer from degraded performance when adapting to new subjects with limited data, as they struggle to preserve both the semantic consistency of stimuli and the alignment of brain responses. To address these challenges, we propose Duala, a dual-level alignment framework designed to achieve stimulus-level consistency and subject-level alignment in fMRI-based cross-subject visual decoding. (1) At the stimulus level, Duala introduces a semantic alignment and relational consistency strategy that preserves intra-class similarity and inter-class separability, maintaining clear semantic boundaries during adaptation. (2) At the subject level, a distribution-based feature perturbation mechanism is developed to capture both global and subject-specific variations, enabling adaptation to individual neural representations without overfitting. Experiments on the Natural Scenes Dataset (NSD) demonstrate that Duala effectively improves alignment across subjects. Remarkably, even when fine-tuned with only about one hour of fMRI data, Duala achieves over 81.1% image-to-brain retrieval accuracy and consistently outperforms existing fine-tuning strategies in both retrieval and reconstruction. Our code is available at https://github.com/ShumengLI/Duala.
- Abstract(参考訳): クロスオブジェクト視覚デコーディングは、個人間での脳活動からの視覚的体験を再構築することを目的としており、よりスケーラブルで実用的な脳-コンピュータインターフェースを実現する。
しかし、既存の方法は、刺激の意味的一貫性と脳の反応の整合性の両方を維持するのに苦慮しているため、限られたデータで新しい被験者に適応する際の劣化したパフォーマンスに悩まされることが多い。
これらの課題に対処するため、fMRIを用いたクロスオブジェクト視覚デコーディングにおいて、刺激レベルの一貫性と主観レベルのアライメントを実現するために設計されたデュアルレベルアライメントフレームワークであるDualaを提案する。
1) 刺激レベルでは, クラス内類似性とクラス間分離性を保ち, 適応中に明確な意味境界を維持するセマンティックアライメントと関係整合性戦略を導入する。
2) 対象レベルでは, 分布に基づく特徴摂動機構が発達し, 大域的・主観的な変化を捉え, オーバーフィッティングを伴わない個々の神経表現への適応が可能となった。
自然シーンデータセット(NSD)の実験は、デュアラが被験者間のアライメントを効果的に改善することを示した。
注目すべきは、わずか1時間のfMRIデータで微調整されたとしても、Dualaは81.1%以上の画像と脳の検索精度を達成し、検索と再構築の両方において既存の微調整戦略を一貫して上回っていることである。
私たちのコードはhttps://github.com/ShumengLI/Duala.comで公開されています。
関連論文リスト
- Fully Differentiable Bidirectional Dual-Task Synergistic Learning for Semi-Supervised 3D Medical Image Segmentation [3.9950415168730107]
半教師付き学習は、ラベルなしデータを活用することにより、画像セグメンテーションのための大きなピクセル単位のラベル付きデータセットの必要性を緩和する。
我々は,4つの重要なSSLコンポーネントをシームレスに統合し,拡張する,完全に微分可能な双方向シナジスティックラーニング(DBiSL)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-10T03:44:24Z) - NeuroBridge: Bio-Inspired Self-Supervised EEG-to-Image Decoding via Cognitive Priors and Bidirectional Semantic Alignment [7.860082818617649]
視覚神経復号は、脳の活動パターンから知覚される視覚刺激を再構成または推論しようとする。
現在のアプローチは、高品質な刺激脳応答対の不足によって制約されている。
本稿では,NuroBridgeという自己教師型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-11-10T08:29:09Z) - Moving Beyond Diffusion: Hierarchy-to-Hierarchy Autoregression for fMRI-to-Image Reconstruction [65.67001243986981]
我々は,スケールワイド自己回帰モデルに基づく粗大なfMRI画像再構成フレームワークであるMindHierを提案する。
MindHierは、拡散ベースのベースラインよりも優れたセマンティック忠実さ、4.67倍高速な推論、より決定論的結果を達成する。
論文 参考訳(メタデータ) (2025-10-25T15:40:07Z) - TS-P$^2$CL: Plug-and-Play Dual Contrastive Learning for Vision-Guided Medical Time Series Classification [26.293489194966003]
1次元の生理的信号を2次元の擬似イメージに変換する視覚誘導パラダイムを導入し、視覚領域へのブリッジを確立する。
マルチコントラスト学習戦略を採用する一方、クロスモーダルアライメントは時系列ダイナミクスと視覚的セマンティクスを協調する。
6つのMedTSデータセットの実験により、TS-P$2$CLは、主題に依存しない設定と対象に依存しない設定の両方で14のメソッドを一貫して上回っていることが示された。
論文 参考訳(メタデータ) (2025-09-22T13:57:58Z) - HDC: Hierarchical Distillation for Multi-level Noisy Consistency in Semi-Supervised Fetal Ultrasound Segmentation [2.964206587462833]
HDCと呼ばれる新しい半教師付きセグメンテーションフレームワークが提案されている。
この枠組みは,特徴表現の整合化のための相関誘導損失と,雑音の多い学生学習を安定化するための相互情報損失の2つの目的を持つ階層的蒸留機構を導入している。
論文 参考訳(メタデータ) (2025-04-14T04:52:24Z) - Two in One Go: Single-stage Emotion Recognition with Decoupled Subject-context Transformer [78.35816158511523]
単段階の感情認識手法として,DSCT(Decoupled Subject-Context Transformer)を用いる。
広範に使われている文脈認識型感情認識データセットであるCAER-SとEMOTICの単段階フレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-04-26T07:30:32Z) - MindDiffuser: Controlled Image Reconstruction from Human Brain Activity
with Semantic and Structural Diffusion [7.597218661195779]
我々はMindDiffuserと呼ばれる2段階の画像再構成モデルを提案する。
ステージ1では、VQ-VAE潜在表現とfMRIからデコードされたCLIPテキスト埋め込みが安定拡散される。
ステージ2では、fMRIからデコードされたCLIP視覚特徴を監視情報として利用し、バックパゲーションによりステージ1でデコードされた2つの特徴ベクトルを継続的に調整し、構造情報を整列させる。
論文 参考訳(メタデータ) (2023-08-08T13:28:34Z) - Joint fMRI Decoding and Encoding with Latent Embedding Alignment [77.66508125297754]
我々はfMRIデコーディングと符号化の両方に対処する統合フレームワークを導入する。
本モデルでは、fMRI信号から視覚刺激を同時に回復し、統合された枠組み内の画像から脳活動を予測する。
論文 参考訳(メタデータ) (2023-03-26T14:14:58Z) - Unsupervised Bidirectional Cross-Modality Adaptation via Deeply
Synergistic Image and Feature Alignment for Medical Image Segmentation [73.84166499988443]
我々は、Synergistic Image and Feature Alignment (SIFA)と名付けられた新しい教師なしドメイン適応フレームワークを提案する。
提案するSIFAは、画像と特徴の両方の観点から、ドメインの相乗的アライメントを行う。
2つの異なるタスクに対する実験結果から,SIFA法は未ラベル対象画像のセグメンテーション性能を向上させるのに有効であることが示された。
論文 参考訳(メタデータ) (2020-02-06T13:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。