論文の概要: Learning Generalizable Action Representations via Pre-training AEMG
- arxiv url: http://arxiv.org/abs/2605.03462v1
- Date: Tue, 05 May 2026 07:50:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.825251
- Title: Learning Generalizable Action Representations via Pre-training AEMG
- Title(参考訳): 事前学習型AEMGによる一般化可能な行動表現の学習
- Authors: Zhenghao Huang, Huilin Yao, Kaikai Wang, Lin Shu,
- Abstract要約: EMGのための大規模な自己教師型表現学習フレームワークであるAny Electromyography (AEMG)を提案する。
AEMGは神経筋のダイナミックスを言語的に再認識し、新しい神経筋収縮トケナイザー(NCT)を用いて、離散的な筋肉収縮を構造的単語に変換する。
AEMGは、最先端の6つのベースラインと比較して、ゼロショット・ワン・オブジェクトアウト(LOSO)の精度を5.79-9.25%向上させることを示した。
- 参考スコア(独自算出の注目度): 1.3478288753277627
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A fundamental role in decoding human motor intent and enabling intuitive human-computer interaction is played by electromyography (EMG). However, its generalization capability across subjects, devices, and tasks remains substantially limited by data heterogeneity, label scarcity, and the lack of a unified representational framework. To bridge this gap, we propose Any Electromyography (AEMG), the first large-scale, self-supervised representation learning framework for EMG. AEMG reconceptualizes neuromuscular dynamics linguistically, utilizing a novel Neuromuscular Contraction Tokenizer (NCT) to translate discrete muscle contractions into structural words and temporal activation patterns into coherent sentences. Furthermore, we compile the largest cross-device EMG signal vocabulary to date, enabling seamless transfer across arbitrary channel topologies and sampling rates. Experiments demonstrate that AEMG improves the zero-shot leave-one-subject-out (LOSO) accuracy by 5.79-9.25% compared to six state-of-the-art baselines, and achieves more than 90% few-shot adaptation performance with only 5% of target user data. Our work has proposed the concept of EMG signals as a cross-device physiological language, learned their grammar from massive amounts of data, and laid the groundwork for a single-training, universally applicable EMG foundation model.
- Abstract(参考訳): 人間の運動意図を復号し、直感的な人間とコンピュータの相互作用を可能にする基本的な役割は、筋電図(EMG)によって演じられる。
しかし、その一般化能力は、データ不均一性、ラベル不足、統一表現フレームワークの欠如などにより、依然として著しく制限されている。
このギャップを埋めるため,EMGのための大規模な自己教師型表現学習フレームワークであるAEMG(Any Electromyography)を提案する。
AEMGは神経筋のダイナミックスを言語的に再認識し、新しい神経筋収縮Tokenizer(NCT)を用いて、離散的な筋肉収縮を構造的単語に、時間的活性化パターンをコヒーレントな文に変換する。
さらに,これまでで最大のデバイス間EMG信号ボキャブラリをコンパイルし,任意のチャネルトポロジとサンプリングレートをシームレスに転送する。
AEMGは6つの最先端ベースラインと比較してゼロショット・ワン・サブジェクト・アウト(LOSO)の精度を5.79-9.25%改善し、ターゲットユーザデータのわずか5%で90%以上の非ショット適応性能を達成した。
我々の研究は、デバイス間生理言語としてのEMG信号の概念を提案し、大量のデータからそれらの文法を学習し、単一学習で普遍的なEMG基盤モデルの基礎を築いた。
関連論文リスト
- Decoding High-Dimensional Finger Motion from EMG Using Riemannian Features and RNNs [1.1534313664323634]
本稿では,コンシューマグレードハードウェアのみを用いた連続EMG-to-kinematicsレグレッションのためのエンドツーエンドフレームワークを提案する。
このフレームワークは、8チャンネルのEMGアームバンドと1つのウェブカメラと自動同期処理を組み合わせたものである。
論文 参考訳(メタデータ) (2026-04-24T12:27:33Z) - CAT-Net: A Cross-Attention Tone Network for Cross-Subject EEG-EMG Fusion Tone Decoding [0.8714814768600078]
本稿では,新たなクロスオブジェクトマルチモーダルBCIデコーディングフレームワークを提案する。
脳波とEMG信号を融合させ、4つのマンダリン音を可聴音と無声音の両方で分類する。
脳波-EMGチャネルを最小化したトーンレベルのデコーディングは,被験者間で実現可能であり,潜在的に一般化可能であることが示唆された。
論文 参考訳(メタデータ) (2025-11-14T03:50:54Z) - REVE: A Foundation Model for EEG -- Adapting to Any Setup with Large-Scale Pretraining on 25,000 Subjects [5.368295573908306]
REVE(Representation for EEG with Versatile Embeddings)は、様々な脳波信号にまたがる一般化を意図した事前訓練モデルである。
我々は25,000人の被験者にまたがる92のデータセットから6万時間以上の脳波データをプレトレーニングしました。
我々は、標準化された脳波研究を支援し、臨床神経科学の進歩を促進するためのコード、事前訓練された体重、チュートリアルをリリースする。
論文 参考訳(メタデータ) (2025-10-24T15:52:46Z) - MEG-GPT: A transformer-based foundation model for magnetoencephalography data [6.336623115095147]
近年のディープラーニングの進歩は、言語や視覚などの他の領域において、大規模に基礎モデルを使用することで、大きな進歩をもたらした。
本稿では,時間アテンションと次の時間ポイント予測を用いたトランスフォーマーベース基盤モデルMEG-GPTを紹介する。
我々は大規模なMEGデータセットから抽出したトークン化された脳領域の時間軸についてMEG-GPTを訓練した。
論文 参考訳(メタデータ) (2025-10-20T20:18:38Z) - WaveMind: Towards a Conversational EEG Foundation Model Aligned to Textual and Visual Modalities [55.00677513249723]
脳波信号は認知過程と固有の神経状態の両方を同時に符号化する。
我々は、EEG信号とその対応するモダリティを統一意味空間にマッピングし、一般化された解釈を実現する。
結果として得られたモデルは、柔軟でオープンな会話をサポートしながら、堅牢な分類精度を示す。
論文 参考訳(メタデータ) (2025-09-26T06:21:51Z) - CRIA: A Cross-View Interaction and Instance-Adapted Pre-training Framework for Generalizable EEG Representations [52.251569042852815]
CRIAは、可変長および可変チャネルコーディングを使用して、異なるデータセット間でEEGデータの統一表現を実現する適応フレームワークである。
このモデルでは、時間的、スペクトル的、空間的特徴を効果的に融合させるクロスアテンション機構を採用している。
テンプル大学脳波コーパスとCHB-MITデータセットによる実験結果から、CRIAは既存の方法よりも、同じ事前学習条件で優れていることが示された。
論文 参考訳(メタデータ) (2025-06-19T06:31:08Z) - CodeBrain: Towards Decoupled Interpretability and Multi-Scale Architecture for EEG Foundation Model [52.466542039411515]
EEGファウンデーションモデル(EFM)は、タスク固有のモデルのスケーラビリティ問題に対処するために登場した。
このギャップを埋めるために設計された2段階のEMFであるCodeBrainを紹介します。
第1段階では、異種時間・周波数の脳波信号を離散トークンに分解するTFDual-Tokenizerを導入する。
第2段階では、構造化されたグローバル畳み込みとスライディングウインドウの注意を結合したマルチスケールEEGSSMアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-06-10T17:20:39Z) - BrainOmni: A Brain Foundation Model for Unified EEG and MEG Signals [46.121056431476156]
異種脳波とMEG記録を対象とする脳基礎モデルBrain Omniを提案する。
既存のアプローチは一般的に、パフォーマンスとクロスドメインのスケーラビリティを制限する、分離、モダリティ、データセット固有のモデルに依存します。
EEGの合計1,997時間、MEGデータの656時間は、事前トレーニングのために公開されているソースからキュレーションされ、標準化されている。
論文 参考訳(メタデータ) (2025-05-18T14:07:14Z) - Geometry of orofacial neuromuscular signals: speech articulation decoding using surface electromyography [0.0]
表面筋電図(EMG)信号を用いた音声明瞭化のためのデータと方法を提案する。
EMGベースの音声ニューロプロテーゼは、知的に話す能力を失った個人において、可聴音声の復元に有望なアプローチを提供する。
論文 参考訳(メタデータ) (2024-11-04T20:31:22Z) - TokenUnify: Scaling Up Autoregressive Pretraining for Neuron Segmentation [65.65530016765615]
本稿では,3つの相補的な学習目標を通じて,大規模依存関係をキャプチャする階層型予測コーディングフレームワークを提案する。
TokenUnifyは、ランダムトークン予測、次のトークン予測、およびすべてのトークン予測を統合して、包括的な表現空間を作成する。
また,120億個の注釈付きボクセルを付加した大規模EMデータセットを導入し,空間連続性を持つ理想的な長周期視覚データを提供する。
論文 参考訳(メタデータ) (2024-05-27T05:45:51Z) - CSLP-AE: A Contrastive Split-Latent Permutation Autoencoder Framework
for Zero-Shot Electroencephalography Signal Conversion [49.1574468325115]
脳波分析の鍵となる目的は、基礎となる神経活動(コンテンツ)を抽出し、個体の変動(スタイル)を考慮することである。
近年の音声変換技術の発展に触発されて,脳波変換を直接最適化するCSLP-AEフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-13T22:46:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。