論文の概要: HCFT: Hierarchical Convolutional Fusion Transformer for EEG Decoding
- arxiv url: http://arxiv.org/abs/2601.12279v1
- Date: Sun, 18 Jan 2026 06:36:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.548078
- Title: HCFT: Hierarchical Convolutional Fusion Transformer for EEG Decoding
- Title(参考訳): HCFT:脳波復号のための階層的畳み込み核融合変換器
- Authors: Haodong Zhang, Jiapeng Zhu, Yitong Chen, Hongqi Li,
- Abstract要約: 階層型脳核融合変換器(HCFT)という軽量な復号化フレームワークを提案する。
HCFTはマルチスケール表現のためにデュアルブランチエンコーダと階層トランスフォーマーブロックを組み合わせる。
その結果、HCFTは平均精度80.83%、BCI IV-2bではコーエンのカッパが0.6165であり、感度99.10%、時間当たり0.0236の偽陽性、CHB-MITでは98.82%であることがわかった。
- 参考スコア(独自算出の注目度): 9.572621097681646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electroencephalography (EEG) decoding requires models that can effectively extract and integrate complex temporal, spectral, and spatial features from multichannel signals. To address this challenge, we propose a lightweight and generalizable decoding framework named Hierarchical Convolutional Fusion Transformer (HCFT), which combines dual-branch convolutional encoders and hierarchical Transformer blocks for multi-scale EEG representation learning. Specifically, the model first captures local temporal and spatiotemporal dynamics through time-domain and time-space convolutional branches, and then aligns these features via a cross-attention mechanism that enables interaction between branches at each stage. Subsequently, a hierarchical Transformer fusion structure is employed to encode global dependencies across all feature stages, while a customized Dynamic Tanh normalization module is introduced to replace traditional Layer Normalization in order to enhance training stability and reduce redundancy. Extensive experiments are conducted on two representative benchmark datasets, BCI Competition IV-2b and CHB-MIT, covering both event-related cross-subject classification and continuous seizure prediction tasks. Results show that HCFT achieves 80.83% average accuracy and a Cohen's kappa of 0.6165 on BCI IV-2b, as well as 99.10% sensitivity, 0.0236 false positives per hour, and 98.82% specificity on CHB-MIT, consistently outperforming over ten state-of-the-art baseline methods. Ablation studies confirm that each core component of the proposed framework contributes significantly to the overall decoding performance, demonstrating HCFT's effectiveness in capturing EEG dynamics and its potential for real-world BCI applications.
- Abstract(参考訳): 脳波デコーディング(EEG)は、多チャンネル信号から複雑な時間的、スペクトル的、空間的特徴を効果的に抽出し統合できるモデルを必要とする。
この課題に対処するために,複数分岐畳み込みエンコーダと階層型トランスフォーマブロックを組み合わせた階層型畳み込み変換器 (HCFT) という軽量で一般化可能な復号化フレームワークを提案する。
具体的には、まず時間領域と時間空間の畳み込み枝を通して局所的時間的・時空間的ダイナミクスを捉え、その後、各段階における分岐間の相互作用を可能にするクロスアテンション機構によってこれらの特徴を整列する。
その後、階層的なトランスフォーマー融合構造を用いて、すべての機能ステージにまたがるグローバル依存関係を符号化し、トレーニング安定性を高め、冗長性を低減するために、従来のレイヤ正規化を置き換えるために、カスタマイズされた動的タン正規化モジュールを導入する。
BCIコンペティションIV-2bとCHB-MITの2つの代表的なベンチマークデータセットを用いて、イベント関連クロスオブジェクト分類と連続発作予測タスクの両方について、広範囲にわたる実験を行った。
HCFTは平均精度80.83%、BCI IV-2bではコーエンのカッパ0.6165、感度99.10%、時間当たり0.0236の偽陽性、CHB-MITでは98.82%の特異性が常に10以上の最先端のベースライン法より優れていた。
アブレーション研究では、提案フレームワークの各コアコンポーネントが全体的なデコード性能に大きく寄与し、脳波のダイナミクスを捕捉するHCFTの有効性と実世界のBCIアプリケーションの可能性を示す。
関連論文リスト
- SKANet: A Cognitive Dual-Stream Framework with Adaptive Modality Fusion for Robust Compound GNSS Interference Classification [47.20483076887704]
グローバルナビゲーション衛星システム(GNSS)は、洗練された妨害による脅威の増大に直面している。
時間周波数画像(TFI)とパワースペクトル密度(PSD)を統合した2重ストリームアーキテクチャに基づく認知的ディープラーニングフレームワークを提案する。
SKANetは96.99%の精度を達成し、複合妨害分類において優れたロバスト性を示した。
論文 参考訳(メタデータ) (2026-01-19T07:42:45Z) - GCMCG: A Clustering-Aware Graph Attention and Expert Fusion Network for Multi-Paradigm, Multi-task, and Cross-Subject EEG Decoding [0.7871262900865523]
運動画像(MI)脳波(EEG)信号に基づく脳-コンピュータインタフェース(BCI)は、人間と機械の相互作用の直接的な経路を提供する。
本稿では,MI-ME EEGデコーディングのための新しい統合フレームワークであるGraph-guided Clustering Mixture-of-Experts CNNGRUGを提案する。
論文 参考訳(メタデータ) (2025-11-29T18:05:33Z) - Bidirectional Time-Frequency Pyramid Network for Enhanced Robust EEG Classification [2.512406961007489]
BITE(Bidirectional Time-Freq Pyramid Network)は、ロバストなマルチストリームシナジー、ピラミッド時間周波数アテンション(PTFA)、双方向適応畳み込みを特徴とするエンドツーエンドの統一アーキテクチャである。
統一アーキテクチャとして、MIタスクとSSVEPタスクの両方にわたる堅牢なパフォーマンスと、例外的な計算効率を組み合わせる。
我々の研究は、信頼性の高いBCIシステムにはスペクトル時間処理が不可欠であることを検証している。
論文 参考訳(メタデータ) (2025-10-11T04:14:48Z) - Bidirectional Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression [97.66080040613726]
特徴空間における動きを暗黙的にモデル化する双方向特徴整合運動変換(Bi-FMT)フレームワークを提案する。
Bi-FMTは、時間的に一貫した潜在表現を生成するために、過去と将来の両方のフレームで機能を調整する。
圧縮効率とランタイムの両方において, Bi-FMT が D-DPCC と AdaDPCC を上回っていることを示す。
論文 参考訳(メタデータ) (2025-09-18T03:51:06Z) - Dual-TSST: A Dual-Branch Temporal-Spectral-Spatial Transformer Model for EEG Decoding [2.0721229324537833]
デュアルブランチ時間スペクトル空間変換器(Dual-TSST)を用いた新しいデコードアーキテクチャネットワークを提案する。
提案するDual-TSSTは様々なタスクにおいて優れており,平均精度80.67%の脳波分類性能が期待できる。
本研究は,高性能脳波デコーディングへの新たなアプローチを提供するとともに,将来のCNN-Transformerベースのアプリケーションにも大きな可能性を秘めている。
論文 参考訳(メタデータ) (2024-09-05T05:08:43Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - Multiple Time Series Fusion Based on LSTM An Application to CAP A Phase
Classification Using EEG [56.155331323304]
本研究では,深層学習に基づく脳波チャンネルの特徴レベル融合を行う。
チャネル選択,融合,分類手順を2つの最適化アルゴリズムで最適化した。
論文 参考訳(メタデータ) (2021-12-18T14:17:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。