論文の概要: Structure-Guided Diffusion Model for EEG-Based Visual Cognition Reconstruction
- arxiv url: http://arxiv.org/abs/2604.22649v1
- Date: Fri, 24 Apr 2026 15:20:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.516745
- Title: Structure-Guided Diffusion Model for EEG-Based Visual Cognition Reconstruction
- Title(参考訳): 脳波を用いた視覚認知再構築のための構造誘導拡散モデル
- Authors: Yongxiang Lian, Yueyang Cang, Pingge Hu, Yuchen He, Li Shi,
- Abstract要約: 脳波(EEG)から視覚情報を復号することは神経科学と脳-コンピュータインターフェース(BCI)研究において重要な問題である。
本稿では,脳波を用いた視覚再構成のための構造情報を含む構造ガイド拡散モデルを提案する。
- 参考スコア(独自算出の注目度): 2.77392799295445
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: Decoding visual information from electroencephalography (EEG) is an important problem in neuroscience and brain-computer interface (BCI) research. Existing methods are largely restricted to natural images and categorical representations, with limited capacity to capture structural features and to differentiate objective perception from subjective cognition. We propose a Structure-Guided Diffusion Model (SGDM) that incorporates explicit structural information for EEG-based visual reconstruction. Approach: SGDM is evaluated on the Kilogram abstract visual object dataset and the THINGS natural image dataset using a two-stage generative mechanism. The framework combines a structurally supervised variational autoencoder with a spatiotemporal EEG encoder aligned to a visual embedding space via contrastive learning. Structural information is integrated into a diffusion model through ControlNet to guide image generation from EEG features. Results: SGDM outperforms existing methods on both abstract and natural image datasets. Reconstructed images achieve higher fidelity in low-level visual features and semantic representations, indicating improved decoding accuracy and strong generalization across diverse visual domains. Spatiotemporal analysis of EEG signals further reveals hierarchical structural encoding patterns, consistent with the neural dynamics of visual cognition. Significance: These findings validate the effectiveness of SGDM in capturing explicit structural geometry and generating images with high fidelity to individual cognitive representations. By enabling decoding of complex visual content from EEG signals, the framework extends neural decoding beyond low-dimensional or categorical outputs. This supports BCIs with increased degrees of freedom for intention decoding and more flexible brain-to-machine communication.
- Abstract(参考訳): 目的:脳波から視覚情報をデコードすること(EEG)は神経科学と脳-コンピュータインターフェース(BCI)研究において重要な問題である。
既存の方法は、主に自然画像や分類的表現に限られており、構造的特徴を捉え、客観的認知と主観的認知を区別する能力に制限がある。
本稿では,脳波を用いた視覚再構成のための構造情報を含む構造ガイド拡散モデルを提案する。
アプローチ:SGDMはKilogram抽象ビジュアルオブジェクトデータセットとTHINGS自然画像データセットを2段階生成機構を用いて評価する。
このフレームワークは、構造的に制御された変分オートエンコーダと、対照的な学習を通して視覚的な埋め込み空間に整合した時空間脳波エンコーダを組み合わせる。
構造情報は、脳波の特徴から画像生成を導くために、ControlNetを介して拡散モデルに統合される。
結果: SGDMは抽象的および自然な画像データセット上で既存の手法より優れている。
再構成された画像は、低レベルの視覚的特徴や意味表現において高い忠実度を実現し、復号精度の向上と多様な視覚領域における強力な一般化を示す。
脳波信号の時空間的解析により、視覚認知の神経力学と整合した階層的構造的符号化パターンが明らかにされる。
意義: これらの知見は, SGDMが明瞭な構造的幾何を捉え, 個々の認知表現に対する忠実度の高い画像を生成することの有効性を検証した。
脳波信号から複雑な視覚的内容の復号を可能にすることにより、このフレームワークは低次元またはカテゴリー出力を超えて神経的復号を拡張できる。
これは、意図的復号化のための自由度を高め、より柔軟な脳-機械間通信をサポートする。
関連論文リスト
- Toward High-Fidelity Visual Reconstruction: From EEG-Based Conditioned Generation to Joint-Modal Guided Rebuilding [1.4594459540658429]
人間の視覚再建は、被験者が提供する記述とそれに対応する神経信号に基づいて、きめ細かい視覚刺激を再構築することを目的としている。
現在のアプローチは、EEG機能をテキストや画像の意味表現に合わせるように強制するアライメントフレームワークと深く結びついています。
本稿では,脳波とテキストを協調学習のための独立したモダリティとして扱い,脳波固有の情報を保存するための新しい統合モーダル視覚再構成フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-20T06:03:56Z) - Moving Beyond Diffusion: Hierarchy-to-Hierarchy Autoregression for fMRI-to-Image Reconstruction [65.67001243986981]
我々は,スケールワイド自己回帰モデルに基づく粗大なfMRI画像再構成フレームワークであるMindHierを提案する。
MindHierは、拡散ベースのベースラインよりも優れたセマンティック忠実さ、4.67倍高速な推論、より決定論的結果を達成する。
論文 参考訳(メタデータ) (2025-10-25T15:40:07Z) - Spatial-Functional awareness Transformer-based graph archetype contrastive learning for Decoding Visual Neural Representations from EEG [3.661246946935037]
本稿では,脳波に基づく視覚的デコーディングを強化するために,空間認識変換器を用いたグラフアーチタイプコントラスト学習(SFTG)フレームワークを提案する。
具体的には、空間的脳の接続性と時間的神経力学を同時に符号化する新しいグラフベースのニューラルアーキテクチャであるEEG Graph Transformer(EGT)を紹介する。
高い対象内変動を緩和するために,特徴の整合性とクラス分離性を改善するために,主観固有の脳波グラフアーチタイプを学習するグラフアーチタイプコントラスト学習(GAC)を提案する。
論文 参考訳(メタデータ) (2025-09-29T13:27:55Z) - Interpretable EEG-to-Image Generation with Semantic Prompts [6.712646807032639]
本モデルでは,脳波信号とセマンティックキャプションをアライメントすることで,直接脳波画像生成をバイパスする。
トランスフォーマーベースの脳波エンコーダは、対照的な学習を通じて脳活動をこれらのキャプションにマッピングする。
このテキストによるフレームワークは、EEGCVPRデータセット上で最先端のビジュアルデコーディングをもたらす。
論文 参考訳(メタデータ) (2025-07-09T17:18:06Z) - CognitionCapturer: Decoding Visual Stimuli From Human EEG Signal With Multimodal Information [61.1904164368732]
脳波信号の表現にマルチモーダルデータを完全に活用する統合フレームワークであるCognitionCapturerを提案する。
具体的には、CognitionCapturerは、各モダリティに対してモダリティエキスパートを訓練し、EEGモダリティからモダリティ情報を抽出する。
このフレームワークは生成モデルの微調整を一切必要とせず、より多くのモダリティを組み込むように拡張することができる。
論文 参考訳(メタデータ) (2024-12-13T16:27:54Z) - Visual Neural Decoding via Improved Visual-EEG Semantic Consistency [3.4061238650474657]
EEG機能をCLIP埋め込みスペースに直接マッピングするメソッドは、マッピングバイアスを導入し、セマンティックな矛盾を引き起こす可能性がある。
最適アライメントを容易にするために,これらの2つのモードのセマンティックな特徴を明示的に抽出する Visual-EEG Semantic Decouple Framework を提案する。
提案手法は,ゼロショットニューラルデコードタスクの最先端化を実現する。
論文 参考訳(メタデータ) (2024-08-13T10:16:10Z) - Controllable Mind Visual Diffusion Model [58.83896307930354]
脳信号の可視化は、人間の視覚システムとコンピュータビジョンモデルの間の重要なインターフェースとして機能する活発な研究領域として登場した。
我々は、制御可能なマインドビジュアルモデル拡散(CMVDM)と呼ばれる新しいアプローチを提案する。
CMVDMは属性アライメントとアシスタントネットワークを用いてfMRIデータから意味情報とシルエット情報を抽出する。
そして、制御モデルを利用して抽出した情報を画像合成に活用し、セマンティクスやシルエットの観点から視覚刺激によく似た画像を生成する。
論文 参考訳(メタデータ) (2023-05-17T11:36:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。