論文の概要: Spatiotemporal Convolutions on EEG signal -- A Representation Learning Perspective on Efficient and Explainable EEG Classification with Convolutional Neural Nets
- arxiv url: http://arxiv.org/abs/2605.03874v1
- Date: Tue, 05 May 2026 15:35:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:44.009554
- Title: Spatiotemporal Convolutions on EEG signal -- A Representation Learning Perspective on Efficient and Explainable EEG Classification with Convolutional Neural Nets
- Title(参考訳): 脳波信号の時空間的畳み込み -畳み込みニューラルネットワークを用いた高効率で説明可能な脳波分類の表現学習視点-
- Authors: Laurits Dixen, Stefan Heinrich, Paolo Burelli,
- Abstract要約: 浅層畳み込みニューラルネットワーク(CNN)を用いた脳波信号の分類は、様々な分野において一般的で成功したアプローチである。
これらのモデルのほとんどは、空間次元と時間次元に沿って独立した一次元(1D)畳み込み層を使用する。
本研究では,2次元の2次元畳み込みを演算する符号化法について検討する。
- 参考スコア(独自算出の注目度): 5.862480696321742
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classification of EEG signals using shallow Convolutional Neural Networks (CNNs) is a prevalent and successful approach across a variety of fields. Most of these models use independent one-dimensional (1D) convolutional layers along the spatial and temporal dimensions, which are concatenated without a non-linear activation layer between. In this paper, we investigate an alternative encoding that operates a bi-dimensional (2D) spatiotemporal convolution. While 2D convolutions are numerically identical to two concatenated 1D convolutions along the two dimensions, the impact on learning is still uncertain. We test 1D and 2D CNNs and a CNN+transformer hybrid model in a low-dimensional (3-channel) and a high-dimensional (22-channel) BCI motor imagery classification task. We observe that 2D convolutions significantly reduce training time in high-dimensional tasks while maintaining performance. We investigate the root of this improvement and find no difference in spectral feature importance. However, a clear pattern emerges in representational similarity across models: 1D and 2D models yield vastly different representational geometries. Overall, we suggest an improved model with a 2D convolutional layer for faster training and inference. We also highlight the importance of architecturally-driven encoding when processing complex multivariate signals, as reflected in internal representations rather than purely in performance metrics.
- Abstract(参考訳): 浅層畳み込みニューラルネットワーク(CNN)を用いた脳波信号の分類は、様々な分野において一般的で成功したアプローチである。
これらのモデルのほとんどは、空間次元と時間次元に沿って独立した一次元(1D)畳み込み層を使用し、非線型活性化層を介さずに連結する。
本稿では,二次元(2次元)時空間畳み込みを演算する符号化方式について検討する。
2次元の畳み込みは2次元に沿った2つの連結した1次元の畳み込みと数値的に同一であるが、学習への影響はまだ不明である。
低次元(3チャンネル)と高次元(22チャンネル)のBCIモータ画像分類タスクにおいて、1Dと2DのCNNとCNN+トランスフォーマーハイブリッドモデルをテストする。
2次元の畳み込みは、性能を維持しながら、高次元タスクのトレーニング時間を著しく短縮する。
この改善のルーツを考察し、スペクトルの特徴の重要性に差は見つからない。
しかし、1Dモデルと2Dモデルは全く異なる表現的ジオメトリが得られる。
全体として、より高速なトレーニングと推論のために、2次元畳み込みレイヤーによるモデルの改善を提案する。
また、内部表現に反映されるような複雑な多変量信号を処理する場合のアーキテクチャ駆動符号化の重要性も強調する。
関連論文リスト
- Dynamic 3D Point Cloud Sequences as 2D Videos [81.46246338686478]
3Dポイントクラウドシーケンスは、現実世界の環境における最も一般的で実用的な表現の1つとして機能する。
textitStructured Point Cloud Videos (SPCV) と呼ばれる新しい汎用表現を提案する。
SPCVは点雲列を空間的滑らかさと時間的一貫性を持つ2Dビデオとして再編成し、画素値は点の3D座標に対応する。
論文 参考訳(メタデータ) (2024-03-02T08:18:57Z) - Spatiotemporal Modeling Encounters 3D Medical Image Analysis:
Slice-Shift UNet with Multi-View Fusion [0.0]
本稿では,2次元CNNにおける3次元特徴をエンコードする2次元モデルSlice SHift UNetを提案する。
より正確にマルチビュー機能は、ボリュームの3次元平面に沿って2次元の畳み込みを実行することで協調的に学習される。
提案手法の有効性は,多モード腹部多臓器軸 (AMOS) と Cranial Vault (BTCV) データセットを越えたマルチアトラスラベリング (Multi-Atlas Labeling Beyond the Cranial Vault) で検証した。
論文 参考訳(メタデータ) (2023-07-24T14:53:23Z) - Unleash the Potential of Image Branch for Cross-modal 3D Object
Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。
まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。
第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文 参考訳(メタデータ) (2023-01-22T08:26:58Z) - Neural Geometric Level of Detail: Real-time Rendering with Implicit 3D
Shapes [77.6741486264257]
本稿では,高忠実度ニューラルネットワークSDFのリアルタイムレンダリングを可能にする,効率的なニューラル表現を提案する。
我々の表現は、以前の作品に比べてレンダリング速度の点で2~3桁の効率であることを示す。
論文 参考訳(メタデータ) (2021-01-26T18:50:22Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z) - STH: Spatio-Temporal Hybrid Convolution for Efficient Action Recognition [39.58542259261567]
本稿では,空間的・時間的映像情報を小さなパラメータで同時に符号化するS-Temporal Hybrid Network(STH)を提案する。
このような設計は、効率的な時間的モデリングを可能にし、小さなモデルスケールを維持する。
STHは、3D CNNよりもパフォーマンス上の優位性を持ち、2D CNNよりもはるかに少ないパラメータコストを維持している。
論文 参考訳(メタデータ) (2020-03-18T04:46:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。