論文の概要: CLEAN-MI: A Scalable and Efficient Pipeline for Constructing High-Quality Neurodata in Motor Imagery Paradigm
- arxiv url: http://arxiv.org/abs/2506.11830v1
- Date: Fri, 13 Jun 2025 14:34:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.831681
- Title: CLEAN-MI: A Scalable and Efficient Pipeline for Constructing High-Quality Neurodata in Motor Imagery Paradigm
- Title(参考訳): CLEAN-MI:モータ画像パラダイムにおける高品質神経データ構築のためのスケーラブルで効率的なパイプライン
- Authors: Dingkun Liu, Zhu Chen, Dongrui Wu,
- Abstract要約: CLEAN-MIは、MIパラダイムで大規模で効率的で正確なニューロデータを構築するためのスケーラブルで体系的なデータ構築パイプラインである。
複数の公開MIデータセットに対するCLEAN-MIの有効性を示し、データ品質と分類性能を一貫した改善を実現した。
- 参考スコア(独自算出の注目度): 14.823896258504154
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The construction of large-scale, high-quality datasets is a fundamental prerequisite for developing robust and generalizable foundation models in motor imagery (MI)-based brain-computer interfaces (BCIs). However, EEG signals collected from different subjects and devices are often plagued by low signal-to-noise ratio, heterogeneity in electrode configurations, and substantial inter-subject variability, posing significant challenges for effective model training. In this paper, we propose CLEAN-MI, a scalable and systematic data construction pipeline for constructing large-scale, efficient, and accurate neurodata in the MI paradigm. CLEAN-MI integrates frequency band filtering, channel template selection, subject screening, and marginal distribution alignment to systematically filter out irrelevant or low-quality data and standardize multi-source EEG datasets. We demonstrate the effectiveness of CLEAN-MI on multiple public MI datasets, achieving consistent improvements in data quality and classification performance.
- Abstract(参考訳): 大規模で高品質なデータセットの構築は、運動画像(MI)ベースの脳コンピュータインタフェース(BCI)において、堅牢で一般化可能な基礎モデルを開発するための基本的な前提条件である。
しかし、異なる被験者やデバイスから収集された脳波信号は、しばしば低信号対雑音比、電極構成の不均一性、および実質的な物体間変動に悩まされ、効果的なモデルトレーニングには重大な課題が生じる。
本稿では,MIパラダイムにおける大規模で効率的な高精度なニューロデータ構築のための,スケーラブルで体系的なデータ構築パイプラインであるCLEAN-MIを提案する。
CLEAN-MIは周波数帯域フィルタリング、チャネルテンプレート選択、主観的スクリーニング、限界分布アライメントを統合し、無関係または低品質なデータを体系的にフィルタリングし、マルチソースのEEGデータセットを標準化する。
複数の公開MIデータセットに対するCLEAN-MIの有効性を示し、データ品質と分類性能を一貫した改善を実現した。
関連論文リスト
- F-ANcGAN: An Attention-Enhanced Cycle Consistent Generative Adversarial Architecture for Synthetic Image Generation of Nanoparticles [3.124884279860061]
F-ANcGANは,限られたデータサンプルを用いて学習可能な,注目度の高いサイクル一貫した生成対向系である。
本モデルでは,構造的関係を捉えるために,自己アテンションを備えたスタイルU-NetジェネレータとU-Netセグメンテーションネットワークを用いる。
論文 参考訳(メタデータ) (2025-05-23T17:02:22Z) - VAE-based Feature Disentanglement for Data Augmentation and Compression in Generalized GNSS Interference Classification [42.14439854721613]
干渉の正確な分類を可能にする重要な潜伏特徴を抽出するために, アンタングル化のための変分オートエンコーダ (VAE) を提案する。
提案するVAEは512から8,192の範囲のデータ圧縮率を実現し,99.92%の精度を実現している。
論文 参考訳(メタデータ) (2025-04-14T13:38:00Z) - CRISP: A Framework for Cryo-EM Image Segmentation and Processing with Conditional Random Field [0.0]
本稿では,Cryo-EMデータから高品質なセグメンテーションマップを自動生成するパイプラインを提案する。
我々のモジュラーフレームワークは、様々なセグメンテーションモデルと損失関数の選択を可能にする。
限られたマイクログラフでトレーニングすると、合成データ上で90%以上の精度、リコール、精度、インターセクション・オーバー・ユニオン(IoU)、F1スコアを達成することができる。
論文 参考訳(メタデータ) (2025-02-12T10:44:45Z) - Evaluating Language Models as Synthetic Data Generators [74.80905172696366]
AgoraBenchは、LMのデータ生成能力を評価するための標準化された設定とメトリクスを提供するベンチマークである。
6つのLMを使って126万のトレーニングインスタンスを合成し、99の学生モデルをトレーニングすることで、LMのデータ生成能力に関する重要な洞察を明らかにする。
論文 参考訳(メタデータ) (2024-12-04T19:20:32Z) - Graph Adapter of EEG Foundation Models for Parameter Efficient Fine Tuning [1.8946099300030472]
これらの課題に対処するために,パラメータ効率のよい微細チューニング(PEFT)手法であるEEG-GraphAdapter (EGA)を提案する。
EGAは、GNNベースのモジュールとしてトレーニング済みの時間バックボーンモデルに統合され、バックボーンを凍結し、アダプタのみを微調整できる。
重度抑うつ障害(MDD)と不規則性検出(TUAB)の2つの医療関連下流課題に対する実験的評価 : 背骨BENDRモデルと比較して,EGAがF1スコアで最大16.1%向上することを示す。
論文 参考訳(メタデータ) (2024-11-25T07:30:52Z) - Curated LLM: Synergy of LLMs and Data Curation for tabular augmentation in low-data regimes [57.62036621319563]
本稿では,Large Language Models (LLMs) の知識を低データ構造におけるデータ拡張に活用したCLLMを紹介する。
従来のジェネレータと比較して,低データ方式におけるCLLMの優れた性能を示す。
論文 参考訳(メタデータ) (2023-12-19T12:34:46Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - Leveraging generative adversarial networks to create realistic scanning
transmission electron microscopy images [2.5954872177280346]
機械学習は、自律的なデータ収集と処理を通じて材料研究に革命をもたらす可能性がある。
我々は,実空間周波数情報を用いたシミュレーションデータを増大させるために,相互空間判別器を備えたサイクル生成逆数ネットワーク(CycleGAN)を用いる。
完全な畳み込みネットワーク(FCN)をトレーニングして、450万個の原子データセット内の単一原子欠陥を同定することで、我々のアプローチを実証する。
論文 参考訳(メタデータ) (2023-01-18T19:19:27Z) - A Generative Learning Approach for Spatio-temporal Modeling in Connected
Vehicular Network [55.852401381113786]
本稿では,コネクテッドカーの無線アクセス遅延を実現するための総合的時間品質フレームワークであるLaMI(Latency Model Inpainting)を提案する。
LaMIはイメージインペイントと合成のアイデアを採用し、2段階の手順で欠落したレイテンシサンプルを再構築することができる。
特に、パッチ方式のアプローチを用いて各地域で収集されたサンプル間の空間的相関を初めて発見し、その後、原点および高度に相関したサンプルをバラエナオートコーダ(VAE)に供給する。
論文 参考訳(メタデータ) (2020-03-16T03:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。