論文の概要: Neural Visual Decoding via Cognitive guided Adaptive Blurring and Information Constrained Alignment
- arxiv url: http://arxiv.org/abs/2605.16418v1
- Date: Thu, 14 May 2026 08:50:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:46.310431
- Title: Neural Visual Decoding via Cognitive guided Adaptive Blurring and Information Constrained Alignment
- Title(参考訳): 認知誘導型適応ブラリングと情報制約アライメントによるニューラルビジュアルデコーディング
- Authors: Fan Yin, Chuhang Zheng, Peiliang Gong, Donghai Guan, Qi Zhu,
- Abstract要約: EEGベースの視覚デコーディングは、神経信号と視覚的意味論のマッピングを確立することを目的としている。
既存のアプローチでは、人間の視覚の動的選択性と神経振動の周波数特異性を無視して、静的な視覚的特徴を扱うのが一般的である。
本稿では、ニューラル・ビジュアル・デコーディングのための情報制約付きアライメント・フレームワークを用いた認知誘導型適応ボケリングであるCAIAを提案する。
- 参考スコア(独自算出の注目度): 15.968559815427193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: EEG-based visual decoding aims to establish a mapping between neural signals and visual semantics. However, it remains constrained by the dual challenges of severe information granularity mismatch and the low signal-to-noise ratio (SNR) of EEG signals. Existing approaches typically treat static visual features, ignoring the dynamic selectivity of human vision and the frequency specificity of neural oscillations. To bridge this gap, we propose CAIA, a Cognitive-guided Adaptive blurring with Information-Constrained Alignment framework for Neural-Visual decoding. On the visual side, it simulates selective attention to adaptively reduce redundancy. Meanwhile, on the EEG side, it leverages neural oscillation priors and the information bottleneck mechanism to enhance SNR. Specifically, we devise a cognitive-dynamics-based adaptive blurring mechanism that dynamically integrates center-biased and saliency-guided visual cues via cross-modal attention. Furthermore, we introduce a distribution-aware boundary calibration loss to robustly rectify alignment bias caused by outlier samples. Moreover, a cognitively-guided information-screening method is proposed to select task-relevant EEG oscillations. Extensive experiments demonstrate that CAIA improves both subject-dependent and subject-independent average Top-1 and Top-5 accuracy in zero-shot brain-to-image retrieval, significantly outperforming prior methods. Our work validates that optimizing visual information density to match neural granularity offers a more interpretable and robust pathway for neural decoding.
- Abstract(参考訳): EEGベースの視覚デコーディングは、神経信号と視覚的意味論のマッピングを確立することを目的としている。
しかし、重度の情報粒度ミスマッチと脳波信号の低信号-雑音比(SNR)の2つの課題に制約が残されている。
既存のアプローチでは、人間の視覚の動的選択性と神経振動の周波数特異性を無視して、静的な視覚的特徴を扱うのが一般的である。
このギャップを埋めるために、ニューラル・ビジュアル・デコーディングのための情報制約付きアライメント・フレームワークを用いた認知誘導適応的ぼかしであるCAIAを提案する。
視覚面では、選択的注意をシミュレートし、冗長性を適応的に減少させる。
一方、脳波側では、神経発振前兆と情報ボトルネック機構を活用してSNRを強化する。
具体的には,認知力学に基づく適応的ぼかし機構を考案し,中心バイアスとサリエンシ誘導の視覚的手がかりを相互注意を通して動的に統合する。
さらに, 配向バイアスの整合性を高めるために, 分布対応境界校正損失を導入する。
さらに,タスク関連脳波の発振を選択するための認知誘導型情報スクリーニング手法を提案する。
広汎な実験により、CAIAはゼロショット脳画像検索において、被写体依存と被写体非依存のTop-1とTop-5の精度を改善し、先行法よりも大幅に向上した。
我々の研究は、視覚情報密度をニューラルネットワークの粒度に合わせるように最適化することで、より解釈可能で堅牢なニューラルデコーディングの経路を提供することを実証している。
関連論文リスト
- ViBE: Visual-to-M/EEG Brain Encoding via Spatio-Temporal VAE and Distribution-Aligned Projection [36.96202443284929]
ViBEは脳磁図(MEG)と脳波(EEG)を視覚刺激から生成するための新しい符号化フレームワークである。
本稿では,M/EEG信号の時間的特性を捉える畳み込み変分オートエンコーダ(TS-CVAE)を提案する。
論文 参考訳(メタデータ) (2026-04-29T01:53:46Z) - V-Co: A Closer Look at Visual Representation Alignment via Co-Denoising [65.5867130156805]
統合JTフレームワークにおける視覚的コデノゲーションの体系的研究であるV-Coについて述べる。
本研究は,視覚的コデノジングを効果的に行うための4つの重要な要素を明らかにする。
V-Coは、基礎となる画素空間拡散ベースラインと強い前の画素拡散法より優れている。
論文 参考訳(メタデータ) (2026-03-17T17:01:54Z) - Deep Models, Shallow Alignment: Uncovering the Granularity Mismatch in Neural Decoding [8.822848795081693]
本稿では,ニューラルネットワークを最終的な出力ではなく,視覚エンコーダの中間表現と整合させる新しいコントラスト学習戦略を提案する。
提案手法は,ニューラル・ビジュアル・デコードにおけるスケーリングの法則を効果的に解き明かし,事前学習された視覚バックボーンの容量でデコード性能を予測可能とした。
論文 参考訳(メタデータ) (2026-01-29T16:30:32Z) - Visual Neural Decoding via Improved Visual-EEG Semantic Consistency [3.4061238650474657]
EEG機能をCLIP埋め込みスペースに直接マッピングするメソッドは、マッピングバイアスを導入し、セマンティックな矛盾を引き起こす可能性がある。
最適アライメントを容易にするために,これらの2つのモードのセマンティックな特徴を明示的に抽出する Visual-EEG Semantic Decouple Framework を提案する。
提案手法は,ゼロショットニューラルデコードタスクの最先端化を実現する。
論文 参考訳(メタデータ) (2024-08-13T10:16:10Z) - CV-Attention UNet: Attention-based UNet for 3D Cerebrovascular Segmentation of Enhanced TOF-MRA Images [2.2265536092123006]
脳血管画像の正確な抽出にはCV-AttentionUNetと呼ばれる3次元脳血管注意UNet法を提案する。
低と高のセマンティクスを組み合わせるために,注意機構を適用した。
このアルゴリズムの新規性は、ラベル付きデータとラベルなしデータの両方でうまく機能する能力にあると考えています。
論文 参考訳(メタデータ) (2023-11-16T22:31:05Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Neural Clamping: Joint Input Perturbation and Temperature Scaling for Neural Network Calibration [62.4971588282174]
我々はニューラルクランプ法と呼ばれる新しい後処理キャリブレーション法を提案する。
実験の結果,Neural Clampingは最先端の処理後のキャリブレーション法よりも優れていた。
論文 参考訳(メタデータ) (2022-09-23T14:18:39Z) - Proactive Pseudo-Intervention: Causally Informed Contrastive Learning
For Interpretable Vision Models [103.64435911083432]
PPI(Proactive Pseudo-Intervention)と呼ばれる新しい対照的な学習戦略を提案する。
PPIは、因果関係のない画像の特徴を保護するために積極的に介入する。
また,重要な画像画素を識別するための,因果的に通知された新たなサリエンスマッピングモジュールを考案し,モデル解釈の容易性を示す。
論文 参考訳(メタデータ) (2020-12-06T20:30:26Z) - Neural encoding with visual attention [17.020869686284165]
トレーニング可能なソフトアテンションモジュールを組み込んだニューラルエンコーディング手法を提案する。
独立データに基づくモデルにより推定された注意位置は、対応する眼球固定パターンとよく一致している。
論文 参考訳(メタデータ) (2020-10-01T16:04:21Z) - Context-Aware Refinement Network Incorporating Structural Connectivity
Prior for Brain Midline Delineation [50.868845400939314]
UNetによって生成された特徴ピラミッド表現を洗練・統合するための文脈対応改良ネットワーク(CAR-Net)を提案する。
正中線における脳の構造的接続性を維持するため、我々は新しい接続性レギュラーロスを導入する。
提案手法は, パラメータを少なくし, 4つの評価指標で3つの最先端手法より優れる。
論文 参考訳(メタデータ) (2020-07-10T14:01:20Z) - ADRN: Attention-based Deep Residual Network for Hyperspectral Image
Denoising [52.01041506447195]
ノイズの多いHSIからクリーンなHSIへのマッピングを学習するために,注目に基づくディープ残差ネットワークを提案する。
実験の結果,提案手法は定量的および視覚的評価において最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-04T08:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。