論文の概要: Shrinking the Teacher: An Adaptive Teaching Paradigm for Asymmetric EEG-Vision Alignment
- arxiv url: http://arxiv.org/abs/2511.11422v1
- Date: Fri, 14 Nov 2025 15:52:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.698908
- Title: Shrinking the Teacher: An Adaptive Teaching Paradigm for Asymmetric EEG-Vision Alignment
- Title(参考訳): 非対称な脳波視覚アライメントのための適応的指導パラダイム
- Authors: Lukun Wu, Jie Li, Ziqi Ren, Kaifan Zhang, Xinbo Gao,
- Abstract要約: 視覚と脳のモダリティの関係は基本的に非対称である。
この非対称性に対処するための適応的な教育パラダイムを提案する。
本手法は,ゼロショット脳画像検索タスクにおいて,トップ1の精度を60.2%向上させる。
- 参考スコア(独自算出の注目度): 42.96122751802762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decoding visual features from EEG signals is a central challenge in neuroscience, with cross-modal alignment as the dominant approach. We argue that the relationship between visual and brain modalities is fundamentally asymmetric, characterized by two critical gaps: a Fidelity Gap (stemming from EEG's inherent noise and signal degradation, vs. vision's high-fidelity features) and a Semantic Gap (arising from EEG's shallow conceptual representation, vs. vision's rich semantic depth). Previous methods often overlook this asymmetry, forcing alignment between the two modalities as if they were equal partners and thereby leading to poor generalization. To address this, we propose the adaptive teaching paradigm. This paradigm empowers the ``teacher" modality (vision) to dynamically shrink and adjust its knowledge structure under task guidance, tailoring its semantically dense features to match the ``student" modality (EEG)'s capacity. We implement this paradigm with the ShrinkAdapter, a simple yet effective module featuring a residual-free design and a bottleneck structure. Through extensive experiments, we validate the underlying rationale and effectiveness of our paradigm. Our method achieves a top-1 accuracy of 60.2\% on the zero-shot brain-to-image retrieval task, surpassing previous state-of-the-art methods by a margin of 9.8\%. Our work introduces a new perspective for asymmetric alignment: the teacher must shrink and adapt to bridge the vision-brain gap.
- Abstract(参考訳): 脳波信号からの視覚的特徴の復号は神経科学における中心的な課題であり、横断的アライメントが主流のアプローチである。
視覚と脳のモダリティの関係は基本的に非対称であり、脳波の固有ノイズと信号劣化から考える)脳波とセマンティックギャップ(脳波の浅い概念的表現から生じる)という2つの重要なギャップが特徴である。
以前の方法では、しばしばこの非対称性を見落とし、2つのモダリティ間のアライメントを等しいパートナーであるかのように強制し、したがって一般化の低さにつながった。
そこで本研究では,適応型教育パラダイムを提案する。
このパラダイムは「教師」のモダリティ(ビジョン)に、タスクガイダンスの下での知識構造を動的に縮小・調整させ、その「学生」のモダリティ(EEG)の能力に合わせて意味的に密集した特徴を調整させる。
ShrinkAdapterは、残余のない設計とボトルネック構造を備えたシンプルで効果的なモジュールである。
広範な実験を通じて,本パラダイムの理論的根拠と有効性を検証する。
本手法は、ゼロショット脳画像検索タスクにおいて、トップ1の精度を60.2\%とし、従来の最先端手法を9.8\%の差で上回った。
私たちの研究は、教師が視覚と脳のギャップを埋めるために縮小し適応しなければならないという、非対称なアライメントに対する新しい視点を導入しました。
関連論文リスト
- NeuroCLIP: Brain-Inspired Prompt Tuning for EEG-to-Image Multimodal Contrastive Learning [13.254096454986318]
脳波から画像へのコントラスト学習に適したプロンプトチューニングフレームワークであるNeuroCLIPを提案する。
我々は初めて視覚的プロンプトトークンを脳波画像アライメントに導入し、グローバルなモダリティレベルのプロンプトとして機能する。
THINGS-EEG2データセットでは、NeuroCLIPはゼロショット画像検索において63.2%のTop-1精度を達成した。
論文 参考訳(メタデータ) (2025-11-12T12:13:24Z) - NeuroBridge: Bio-Inspired Self-Supervised EEG-to-Image Decoding via Cognitive Priors and Bidirectional Semantic Alignment [7.860082818617649]
視覚神経復号は、脳の活動パターンから知覚される視覚刺激を再構成または推論しようとする。
現在のアプローチは、高品質な刺激脳応答対の不足によって制約されている。
本稿では,NuroBridgeという自己教師型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-11-10T08:29:09Z) - TS-P$^2$CL: Plug-and-Play Dual Contrastive Learning for Vision-Guided Medical Time Series Classification [26.293489194966003]
1次元の生理的信号を2次元の擬似イメージに変換する視覚誘導パラダイムを導入し、視覚領域へのブリッジを確立する。
マルチコントラスト学習戦略を採用する一方、クロスモーダルアライメントは時系列ダイナミクスと視覚的セマンティクスを協調する。
6つのMedTSデータセットの実験により、TS-P$2$CLは、主題に依存しない設定と対象に依存しない設定の両方で14のメソッドを一貫して上回っていることが示された。
論文 参考訳(メタデータ) (2025-09-22T13:57:58Z) - Decouple before Align: Visual Disentanglement Enhances Prompt Tuning [85.91474962071452]
プロンプトチューニング(PT)は、視覚言語モデルのタスク固有の伝達性を改善する際、顕著な効果を示した。
本稿では,従来見過ごされていた情報非対称性の問題について述べる。
本稿では,直感的なデカプリアライン概念に基づく効果的なPTフレームワークであるDAPTを提案する。
論文 参考訳(メタデータ) (2025-08-01T07:46:00Z) - Mind the Gap: Aligning Vision Foundation Models to Image Feature Matching [31.42132290162457]
IMD (Image Feature Matching with a Pre-trained Diffusion model) と呼ばれる新しいフレームワークを2つのパーツで導入する。
グローバルセマンティクスを重視したコントラッシブラーニングに基づく基礎モデルを用いた支配的なソリューションとは異なり、生成的拡散モデルを統合する。
提案したIMMは,評価されたベンチマークにおいて新たな最先端性を確立し,IMIMの優れた12%の改善は,この手法の誤認識を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2025-07-14T14:28:15Z) - Interpretable Few-Shot Image Classification via Prototypical Concept-Guided Mixture of LoRA Experts [79.18608192761512]
自己説明可能なモデル(SEM)は、視覚認識プロセスをより解釈可能なものにするために、プロトタイプ概念学習(PCL)に依存している。
パラメトリック不均衡と表現の不整合という2つの重要な課題を緩和するFew-Shotプロトタイプ概念分類フレームワークを提案する。
我々のアプローチは、既存のSEMを顕著な差で常に上回っており、5-way 5-shot分類では4.2%-8.7%の相対的な利得がある。
論文 参考訳(メタデータ) (2025-06-05T06:39:43Z) - Extremely Fine-Grained Visual Classification over Resembling Glyphs in the Wild [15.102325077732745]
グリフに類似した認識課題に対する2段階のコントラスト学習手法を提案する。
最初の段階では、教師付きコントラスト学習を利用してラベル情報を利用してバックボーンネットワークをウォームアップする。
第2段階では、Euclidean空間とAngular空間の両方で分類とコントラスト学習を統合するネットワークアーキテクチャであるCCFG-Netを導入する。
論文 参考訳(メタデータ) (2024-08-25T08:59:27Z) - Visual Prompt Tuning in Null Space for Continual Learning [51.96411454304625]
既存のプロンプトチューニング手法は、継続学習(CL)における印象的な性能を示す。
本稿では,従来のタスクの特徴に代表される部分空間に直交する方向のプロンプトを調整し,各タスクを学習することを目的とする。
実際には、即時勾配予測を実装するために、実効的なヌル空間に基づく近似解が提案されている。
論文 参考訳(メタデータ) (2024-06-09T05:57:40Z) - ADPS: Asymmetric Distillation Post-Segmentation for Image Anomaly
Detection [75.68023968735523]
知識蒸留に基づく異常検出 (KDAD) 法は, 異常領域を検出し, セグメント化するために, 教師学生のパラダイムに頼っている。
非対称蒸留ポストセグメンテーション(ADPS)と呼ばれる革新的なアプローチを提案する。
我々のADPSは、教師-学生ネットワークの入力と同じイメージの異なる形態の非対称蒸留パラダイムを採用している。
ADPSは,MVTec ADとKolektorSDD2データセットで平均精度(AP)を9%,20%向上させることを示した。
論文 参考訳(メタデータ) (2022-10-19T12:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。