Fugu-MT 論文翻訳(概要): Multi-View Contrastive Network (MCNet) for Motor Imagery Classification

論文の概要: Multi-View Contrastive Network (MCNet) for Motor Imagery Classification

arxiv url: http://arxiv.org/abs/2502.17482v1
Date: Tue, 18 Feb 2025 10:30:53 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-26 17:42:44.943449
Title: Multi-View Contrastive Network (MCNet) for Motor Imagery Classification
Title（参考訳）: モータ画像分類のためのMulti-View Contrastive Network (MCNet)
Authors: Ziwei Wang, Siyang Li, Xiaoqing Chen, Wei Li, Dongrui Wu,
Abstract要約: 本稿では,運動画像(MI)脳波復号のための知識駆動型時間空間ベースマルチビューコントラストネットワーク(MCNet)を提案する。我々は、異なる拡張ビューから学習するクロスビューコントラストモジュールと、知識誘導モデルとデータ駆動モデルの間で抽出された機能の一貫性を高めるクロスモデルコントラストモジュールを導入する。
参考スコア（独自算出の注目度）: 20.78236894605647
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Objective: An electroencephalography (EEG)-based brain-computer interface (BCI) serves as a direct communication pathway between the human brain and an external device. While supervised learning has been extensively explored for motor imagery (MI) EEG classification, small data quantity has been a key factor limiting the performance of deep feature learning. Methods: This paper proposes a knowledge-driven time-space-frequency based multi-view contrastive network (MCNet) for MI EEG decoding in BCIs. MCNet integrates knowledge from the time, space, and frequency domains into the training process through data augmentations from multiple views, fostering more discriminative feature learning of the characteristics of EEG data. We introduce a cross-view contrasting module to learn from different augmented views and a cross-model contrasting module to enhance the consistency of features extracted between knowledge-guided and data-driven models. Results: The combination of EEG data augmentation strategies was systematically investigated for more informative supervised contrastive learning. Experiments on four public MI datasets and three different architectures demonstrated that MCNet outperformed 10 existing approaches. Significance: Our approach can significantly boost EEG classification performance beyond designated networks, showcasing the potential to enhance the feature learning process for better EEG decoding.
Abstract（参考訳）: 目的:脳波(EEG)ベースの脳コンピュータインタフェース(BCI)は、ヒト脳と外部デバイスとの間の直接的な通信経路として機能する。教師付き学習は運動画像(MI)脳波分類において広範囲に研究されてきたが、データ量が少ないことが特徴学習の性能を左右する重要な要因となっている。方法:BCIにおけるMI EEGデコーディングのための知識駆動型時間空間ベースマルチビューコントラストネットワーク(MCNet)を提案する。 MCNetは、時間、空間、周波数の知識を複数のビューからのデータ拡張を通じてトレーニングプロセスに統合し、EEGデータの特徴をより識別可能な特徴学習を促進する。我々は、異なる拡張ビューから学習するクロスビューコントラストモジュールと、知識誘導モデルとデータ駆動モデルの間で抽出された機能の一貫性を高めるクロスモデルコントラストモジュールを導入する。結果: 教師付きコントラスト学習において, 脳波データ拡張戦略の組み合わせを体系的に検討した。 4つのパブリックMIデータセットと3つの異なるアーキテクチャの実験は、MCNetが既存の10のアプローチより優れていることを示した。意義:我々のアプローチは、指定されたネットワーク以上のEEG分類性能を大幅に向上させ、より優れたEEG復号化のために機能学習プロセスを強化する可能性を示す。

関連論文リスト

TUNA: Taming Unified Visual Representations for Native Unified Multimodal Models [96.41974190202642]
統一マルチモーダルモデル(UMM)は,単一のフレームワーク内でのマルチモーダル理解と生成を共同で行うことを目的としている。本稿では、VAEエンコーダを表現エンコーダでカスケードすることで、統一された連続的な視覚表現を構築するネイティブUMMであるTUNAを提案する。
論文参考訳（メタデータ） (2025-12-01T18:59:51Z)
Complementary and Contrastive Learning for Audio-Visual Segmentation [74.11434759171199]
本稿では,ローカル情報とグローバル情報の両方を処理可能な新しいフレームワークであるComplementary and Contrastive Transformer(CCFormer)を提案する。提案手法は,S4, MS3, AVSSデータセットにまたがる最先端のベンチマークを新たに設定する。
論文参考訳（メタデータ） (2025-10-11T06:36:59Z)
MGCR-Net:Multimodal Graph-Conditioned Vision-Language Reconstruction Network for Remote Sensing Change Detection [55.702662643521265]
マルチモーダルデータのセマンティックインタラクション機能を検討するために,マルチモーダルグラフ条件付き視覚言語再構成ネットワーク(MGCR-Net)を提案する。 4つの公開データセットによる実験結果から,MGCRは主流CD法に比べて優れた性能を示した。
論文参考訳（メタデータ） (2025-08-03T02:50:08Z)
MSLAU-Net: A Hybird CNN-Transformer Network for Medical Image Segmentation [7.826754189244901]
CNNベースの手法とトランスフォーマーベースの手法の両方が、医用画像分割タスクにおいて顕著な成功を収めている。両パラダイムの長所を統合した新しいハイブリッドCNN-Transformerアーキテクチャ MSLAU-Netを提案する。提案したMSLAU-Netには,2つの重要なアイデアが組み込まれている。まず,医療画像からマルチスケール特徴を効率的に抽出する,マルチスケール線形注意(multi-Scale Linear Attention)が導入されている。第二に、マルチレベル特徴集約を行い、空間分解能を復元するトップダウン特徴集約機構を採用する。
論文参考訳（メタデータ） (2025-05-24T18:48:29Z)
GAME: Learning Multimodal Interactions via Graph Structures for Personality Trait Estimation [13.071227081328288]
ショートビデオからの明瞭なパーソナリティ分析は、視覚的、聴覚的、およびテキスト的手がかりの複雑な相互作用のため、重要なチャルレンジを呈する。本稿では,グラフ拡張型マルチモーダル進化法であるGAMEを提案する。ビジュアルストリームのために、顔グラフを構築し、グラフ畳み込みネットワーク(GCN)と畳み込みニューラルネットワーク(CNN)を組み合わせたデュアルブランチGeo Two-Stream Networkを導入する。時間的ダイナミクスを捉えるために、フレームレベルの特徴はBiGによって処理される
論文参考訳（メタデータ） (2025-05-05T13:48:09Z)
An Efficient and Mixed Heterogeneous Model for Image Restoration [71.85124734060665]
現在の主流のアプローチは、CNN、Transformers、Mambasの3つのアーキテクチャパラダイムに基づいている。混合構造融合に基づく効率的で汎用的なIRモデルであるRestorMixerを提案する。
論文参考訳（メタデータ） (2025-04-15T08:19:12Z)
BIMII-Net: Brain-Inspired Multi-Iterative Interactive Network for RGB-T Road Scene Semantic Segmentation [6.223341988991549]
我々は、BIMII-Net(Brain-Inspired Multi-Iteration Interaction Network)と呼ばれる新しいRGB-Tロードシーンセマンティックセマンティックネットワークを提案する。まず、自律運転のような道路シナリオにおける正確なテクスチャと局所情報抽出の要件を満たすため、脳にインスパイアされたモデルに基づく深部連続結合ニューラルネットワーク(DCCNN)アーキテクチャを提案する。第2に,BIMII-Netの機能融合段階において,多モード情報間の相互作用と表現能力を高めるために,クロス明示的な注意強調融合モジュール (CEAEF-Module) を設計した。最後に,相補的対話型多層復号器を構築した。
論文参考訳（メタデータ） (2025-03-25T03:09:46Z)
Multimodal-Aware Fusion Network for Referring Remote Sensing Image Segmentation [7.992331117310217]
リモートセンシング画像セグメンテーション(RRSIS)は、リモートセンシング画像セグメンテーションにおける新しい視覚課題である。我々は,2つのモード間の微粒なアライメントと融合を実現するために,マルチモーダル・アウェア・フュージョン・ネットワーク(MAFN)を設計する。
論文参考訳（メタデータ） (2025-03-14T08:31:21Z)
Optimized Unet with Attention Mechanism for Multi-Scale Semantic Segmentation [8.443350618722564]
本稿では,注目機構と組み合わさった改良されたUnetモデルを提案する。チャネルアテンションと空間アテンションモジュールを導入し、重要な特徴にフォーカスするモデルの能力を強化する。改良されたモデルは、mIoUとピクセル精度(PA)でよく機能し、それぞれ76.5%と95.3%に達した。
論文参考訳（メタデータ） (2025-02-06T06:51:23Z)
CognitionCapturer: Decoding Visual Stimuli From Human EEG Signal With Multimodal Information [61.1904164368732]
脳波信号の表現にマルチモーダルデータを完全に活用する統合フレームワークであるCognitionCapturerを提案する。具体的には、CognitionCapturerは、各モダリティに対してモダリティエキスパートを訓練し、EEGモダリティからモダリティ情報を抽出する。このフレームワークは生成モデルの微調整を一切必要とせず、より多くのモダリティを組み込むように拡張することができる。
論文参考訳（メタデータ） (2024-12-13T16:27:54Z)
Online Multi-modal Root Cause Analysis [61.94987309148539]
ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。 OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文参考訳（メタデータ） (2024-10-13T21:47:36Z)
INF-LLaVA: Dual-perspective Perception for High-Resolution Multimodal Large Language Model [71.50973774576431]
本稿では,高解像度画像認識のための新しいMLLM INF-LLaVAを提案する。我々はDCM(Dual-perspective Cropping Module)を導入し、各サブイメージが局所的な視点から連続的な詳細を含むことを保証する。第2に,グローバルな特徴と局所的な特徴の相互強化を可能にするDEM(Dual-perspective Enhancement Module)を導入する。
論文参考訳（メタデータ） (2024-07-23T06:02:30Z)
A Knowledge-Driven Cross-view Contrastive Learning for EEG Representation [48.85731427874065]
本稿では,限られたラベルを持つ脳波から効果的な表現を抽出する知識駆動型クロスビューコントラスト学習フレームワーク(KDC2)を提案する。 KDC2法は脳波信号の頭皮と神経のビューを生成し、脳活動の内部および外部の表現をシミュレートする。ニューラル情報整合性理論に基づく事前のニューラル知識をモデル化することにより、提案手法は不変かつ相補的なニューラル知識を抽出し、複合表現を生成する。
論文参考訳（メタデータ） (2023-09-21T08:53:51Z)
Epistemic Graph: A Plug-And-Play Module For Hybrid Representation Learning [46.48026220464475]
人間はハイブリッド学習を示し、クロスドメイン認識のための構造化された知識をシームレスに統合したり、少量の学習のために少量のデータサンプルに依存する。本稿では, 深部特徴と構造化知識グラフ間の情報交換を促進し, ハイブリッド学習を実現するための新しいエピステミックグラフ層(EGLayer)を提案する。
論文参考訳（メタデータ） (2023-05-30T04:10:15Z)
LMDA-Net:A lightweight multi-dimensional attention network for general EEG-based brain-computer interface paradigms and interpretability [2.3945862743903916]
LMDA-Netと呼ばれる,軽量な多次元アテンションネットワークを提案する。 EEG信号用に設計された2つの新しいアテンションモジュールを組み込むことで、LMDA-Netは複数の次元の特徴を効果的に統合できる。 LMDA-Netは、分類精度とボラティリティの予測の観点から、他の代表的手法よりも優れている。
論文参考訳（メタデータ） (2023-03-29T02:35:02Z)
DoubleU-NetPlus: A Novel Attention and Context Guided Dual U-Net with Multi-Scale Residual Feature Fusion Network for Semantic Segmentation of Medical Images [2.20200533591633]
本稿ではDoubleU-NetPlusという2つのU-Netアーキテクチャを提案する。我々は,識別的特徴表現をモデル化するネットワークの能力を高めるために,マルチコンテキスト特徴といくつかの注意戦略を利用する。勾配消滅問題を緩和し、より深い空間的詳細を持つ高分解能特徴を取り入れるため、標準畳み込み操作を注意誘導残差畳み込み操作に置き換える。
論文参考訳（メタデータ） (2022-11-25T16:56:26Z)
EEG-ITNet: An Explainable Inception Temporal Convolutional Network for Motor Imagery Classification [0.5616884466478884]
我々はEEG-ITNetと呼ばれるエンドツーエンドのディープラーニングアーキテクチャを提案する。本モデルでは,多チャンネル脳波信号からスペクトル,空間,時間情報を抽出することができる。 EEG-ITNetは、異なるシナリオにおける分類精度を最大5.9%改善する。
論文参考訳（メタデータ） (2022-04-14T13:18:43Z)
Tensor-CSPNet: A Novel Geometric Deep Learning Framework for Motor Imagery Classification [14.95694356964053]
対称正定値(SPD)上での脳波信号を特徴付ける幾何学的深層学習フレームワークCSPNetを提案する。 CSPNetは、2つのMI-EEGデータセットのクロスバリデーションとホールドアウトシナリオにおいて、現在の最先端のパフォーマンスを達成またはわずかに上回る。
論文参考訳（メタデータ） (2022-02-05T02:52:23Z)
Cross-Modality Deep Feature Learning for Brain Tumor Segmentation [158.8192041981564]
本稿では, マルチモーダルMRIデータから脳腫瘍を抽出するクロスモーダルディープ・フィーチャーラーニング・フレームワークを提案する。中心となる考え方は、不十分なデータスケールを補うために、マルチモダリティデータにまたがる豊富なパターンをマイニングすることだ。 on the BraTS benchmarks, this proposed cross-modality deep feature learning framework could effective improve the brain tumor segmentation performance。
論文参考訳（メタデータ） (2022-01-07T07:46:01Z)
Full-Duplex Strategy for Video Object Segmentation [141.43983376262815]
Full- Strategy Network (FSNet)はビデオオブジェクトセグメンテーション(VOS)のための新しいフレームワークである我々のFSNetは、融合復号ステージの前に、クロスモーダルな機能パス(すなわち、送信と受信)を同時に実行します。我々のFSNetは、VOSとビデオの有能なオブジェクト検出タスクの両方において、他の最先端技術よりも優れていることを示す。
論文参考訳（メタデータ） (2021-08-06T14:50:50Z)
CNN-based Approaches For Cross-Subject Classification in Motor Imagery: From The State-of-The-Art to DynamicNet [0.2936007114555107]
運動画像(MI)ベースの脳-コンピュータインタフェース(BCI)システムは、コミュニケーションと制御の代替手段を提供するためにますます採用されています。信頼できるBCIシステムを得るには、脳信号からMIを正確に分類することが不可欠です。ディープラーニングアプローチは、標準的な機械学習技術の有効な代替手段として現れ始めている。
論文参考訳（メタデータ） (2021-05-17T14:57:13Z)
Encoder Fusion Network with Co-Attention Embedding for Referring Image Segmentation [87.01669173673288]
本稿では,視覚的エンコーダをマルチモーダルな特徴学習ネットワークに変換するエンコーダ融合ネットワーク(EFN)を提案する。 EFNには、マルチモーダル機能の並列更新を実現するコアテンションメカニズムが組み込まれている。 4つのベンチマークデータセットによる実験結果から,提案手法がポストプロセッシングを伴わずに最先端の性能を実現することを示す。
論文参考訳（メタデータ） (2021-05-05T02:27:25Z)
MVFNet: Multi-View Fusion Network for Efficient Video Recognition [79.92736306354576]
分離可能な畳み込みを効率よく利用し,ビデオの複雑さを生かしたマルチビュー融合(MVF)モジュールを提案する。 MVFNetは一般的なビデオモデリングフレームワークと考えることができる。
論文参考訳（メタデータ） (2020-12-13T06:34:18Z)
Visual Concept Reasoning Networks [93.99840807973546]
分割変換マージ戦略は、視覚認識タスクのための畳み込みニューラルネットワークのアーキテクチャ制約として広く使用されている。我々は、この戦略を利用して、高レベルの視覚概念間の推論を可能にするために、Visual Concept Reasoning Networks (VCRNet) と組み合わせることを提案する。提案するモデルであるVCRNetは、パラメータ数を1%以下にすることで、一貫して性能を向上する。
論文参考訳（メタデータ） (2020-08-26T20:02:40Z)
Few-Shot Relation Learning with Attention for EEG-based Motor Imagery Classification [11.873435088539459]
脳波(EEG)信号に基づく脳-コンピュータインタフェース(BCI)が注目されている。運動画像(MI)データは、リハビリテーションや自律運転のシナリオに使用することができる。脳波に基づくBCIシステムにはMI信号の分類が不可欠である。
論文参考訳（メタデータ） (2020-03-03T02:34:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。