論文の概要: Channel-Oriented Design for EEG-to-Music Reconstruction
- arxiv url: http://arxiv.org/abs/2606.04040v1
- Date: Tue, 02 Jun 2026 04:13:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.261342
- Title: Channel-Oriented Design for EEG-to-Music Reconstruction
- Title(参考訳): 脳波から音楽への再構成のためのチャネル指向設計
- Authors: Jiaxin Qing, Junwei Lu, Lexin Li,
- Abstract要約: 我々は,信号が弱く,分散し,ノイズやチャネルの可変性に敏感な脳波から音楽への再構成について検討した。
我々の中心的な発見は、初期のチャネル混合は弱いが差別的な脳波信号を破壊することである。
本稿では,3つの主成分を持つチャネル指向設計を提案する。
- 参考スコア(独自算出の注目度): 10.381688641790632
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Brain-computer interfaces aim to decode naturalistic stimuli from neural signals, yet most progress to date has focused on vision and language. In this article, we study a more challenging but far less explored setting, EEG-to-music reconstruction, where signals are weak, distributed, and highly susceptible to noise and channel variability. Our central finding is that early channel mixing destroys weak but discriminative EEG signals. To address this, we propose a channel-oriented design with three key components. Specifically, channel-wise tokenization treats each electrode as an explicit token to retain spatially localized neural evidence, channel-wise multi-view self-distillation enforces consistency across temporal crops and random channel subsets to learn robust and distributed representations, and channel-wise data augmentation introduces structured channel dropout to improve invariance to noise, artifacts, and missing electrodes. Together, these components preserve weak yet informative signals across channels and enable stable alignment to a semantic music representation space. We integrate this channel-oriented design within an encoding-alignment-decoding pipeline for EEG-to-music reconstruction. Theoretically, we characterize when preserving channel-level structure leads to improved alignment. Empirically, we compare with a range of state-of-the-art baselines and demonstrate consistent and significant performance gains.
- Abstract(参考訳): 脳-コンピュータインタフェースは、神経信号から自然主義的な刺激をデコードすることを目的としている。
本稿では、信号が弱く、分散し、ノイズやチャネルの可変性に非常に敏感な脳波から音楽への再構成という、より困難な状況について研究する。
我々の中心的な発見は、初期のチャネル混合は弱いが差別的な脳波信号を破壊することである。
そこで本研究では,3つのキーコンポーネントを持つチャネル指向設計を提案する。
具体的には、チャネル単位のトークン化は、各電極を明示的なトークンとして扱うことにより、空間的に局所化された神経エビデンスを保持し、チャネル単位のマルチビュー自己蒸留は、時間的作物とランダムチャネルサブセット間の一貫性を強制し、堅牢で分散した表現を学習し、チャネル単位のデータ拡張は、構造化されたチャネルドロップアウトを導入し、ノイズ、アーティファクト、欠落電極への不変性を改善する。
これらのコンポーネントは、チャンネル間の弱いが情報的な信号を保持し、セマンティックな音楽表現空間への安定したアライメントを可能にする。
我々はこのチャネル指向設計を脳波から音楽への再構成のための符号化・アライメント・デコーディングパイプラインに統合する。
理論的には、チャネルレベルの構造を保存するとアライメントが改善される。
経験的に、我々は最先端のベースラインと比較し、一貫性と顕著なパフォーマンス向上を示します。
関連論文リスト
- Channel-Free Human Activity Recognition via Inductive-Bias-Aware Fusion Design for Heterogeneous IoT Sensor Environments [0.0]
モノのインターネット(IoT)環境におけるヒューマンアクティビティ認識(HAR)は、異種センサー設定に対処しなければならない。
本研究では,単一共有モデルが入力チャネルの固定数,順序,意味的な配置を仮定することなく推論を行う,厳密なチャネルフリーHARについて検討する。
本稿では,チャネルワイドエンコーディングと共有エンコーダ,メタデータ条件付き遅延融合,チャネルレベルおよび融合予測の協調最適化を組み合わせたチャネルフリーHARフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-23T07:32:36Z) - DC-ViT: Modulating Spatial and Channel Interactions for Multi-Channel Images [9.507520646516719]
マルチチャネルイメージング(MCI)のトレーニングと評価は、異種チャネル構成のため、依然として困難である。
最近のMulti-Channel Vision Transformers (MC-ViTs)は、フレキシブルなチャネル入力を可能にすることでこの問題に対処している。
Decoupled Self-Attention (DSA)を用いて情報共有を明示的に制御するDecoupled Vision Transformer (DC-ViT)を提案する。
論文 参考訳(メタデータ) (2026-03-15T08:31:34Z) - CAMEL-CLIP: Channel-aware Multimodal Electroencephalography-text Alignment for Generalizable Brain Foundation Models [5.527305245660595]
マルチモーダルなEEGテキストアライメントコントラスト言語画像事前学習モデル(CAMEL-CLIP)を提案する。
我々は,CAMEL-CLIPが線形探索による最先端性能を実現し,フルファインタニングに依存した既存の基礎モデルより優れていることを示す。
論文 参考訳(メタデータ) (2026-02-27T05:05:08Z) - Discrete-Space Generative AI Pipeline for Semantic Transmission of Signals [0.2291770711277359]
Discernmentは、GenAIモデルを使用して技術チャネル上で物理信号(ベースバンド無線とオーディオ)の意味を伝達するセマンティック通信システムである。
チャネル容量が著しく低下しても,ディスクナーメントはセマンティックな整合性を維持していることを示す。
論文 参考訳(メタデータ) (2026-02-14T02:11:46Z) - CP Loss: Channel-wise Perceptual Loss for Time Series Forecasting [67.3477355449697]
時系列データに対するチャネルワイド知覚損失(CP損失)を提案する。
我々は,その特性に適応した各チャネルに対して,独自の知覚空間を学習する。
これらの知覚空間内で損失を計算し、モデルを最適化する。
論文 参考訳(メタデータ) (2026-01-25T15:31:37Z) - EEGChaT: A Transformer-Based Modular Channel Selector for SEEG Analysis [33.75063804360241]
本稿では,SEEGデータ解析のための新しいトランスフォーマーベースのチャネル選択モジュールであるEEGChaTを提案する。
EEGChaTはデコード精度を継続的に改善し,最大17%の絶対ゲインを実現している。
その結果,EEGChaTは高次元SEEG解析におけるチャネル選択に有効で一般化可能な解であることが示唆された。
論文 参考訳(メタデータ) (2025-10-15T14:22:07Z) - Rethinking Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising [94.09442506816724]
BSN(Blind-spot Network)は、自己教師付き画像復調(SSID)におけるニューラルネットワークアーキテクチャとして広く使われている。
本研究では,Transformer ベースの Blind-Spot Network (TBSN) を構築した。
論文 参考訳(メタデータ) (2024-04-11T15:39:10Z) - Robust learning from corrupted EEG with dynamic spatial filtering [68.82260713085522]
実験室の外で記録されたEEGを使用して機械学習モデルを構築するには、ノイズの多いデータとランダムに欠落するチャネルにロバストな方法が必要である。
ニューラルネットワークの第1層の前に挿入可能なマルチヘッドアテンションモジュールである動的空間フィルタリング(DSF)を提案する。
筆者らは, チャネル汚損を模擬した4000件の録音を含む公開脳波データと, 自然汚損をともなう移動脳波の自家記録100件のプライベートデータセットを用いて, DSFを試験した。
論文 参考訳(メタデータ) (2021-05-27T02:33:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。