論文の概要: Deep learning for ECoG brain-computer interface: end-to-end vs.
hand-crafted features
- arxiv url: http://arxiv.org/abs/2210.02544v1
- Date: Wed, 5 Oct 2022 20:18:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 17:37:21.651518
- Title: Deep learning for ECoG brain-computer interface: end-to-end vs.
hand-crafted features
- Title(参考訳): ECoG脳-コンピュータインタフェースの深層学習--エンドツーエンドと手作り機能
- Authors: Maciej \'Sliwowski, Matthieu Martin, Antoine Souloumiac, Pierre
Blanchart, Tetiana Aksenova
- Abstract要約: 脳信号は時間的データであり、低信号対雑音比、不確実なラベル、非定常データである。
これらの要因はトレーニングプロセスに影響を与え、モデルのパフォーマンス改善を遅くする可能性がある。
本稿では,BCIモータ画像復号における生のECoG信号と時間周波数特徴を用いたモデルを比較した。
- 参考スコア(独自算出の注目度): 4.7773230870500605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In brain signal processing, deep learning (DL) models have become commonly
used. However, the performance gain from using end-to-end DL models compared to
conventional ML approaches is usually significant but moderate, typically at
the cost of increased computational load and deteriorated explainability. The
core idea behind deep learning approaches is scaling the performance with
bigger datasets. However, brain signals are temporal data with a low
signal-to-noise ratio, uncertain labels, and nonstationary data in time. Those
factors may influence the training process and slow down the models'
performance improvement. These factors' influence may differ for end-to-end DL
model and one using hand-crafted features. As not studied before, this paper
compares models that use raw ECoG signal and time-frequency features for BCI
motor imagery decoding. We investigate whether the current dataset size is a
stronger limitation for any models. Finally, obtained filters were compared to
identify differences between hand-crafted features and optimized with
backpropagation. To compare the effectiveness of both strategies, we used a
multilayer perceptron and a mix of convolutional and LSTM layers that were
already proved effective in this task. The analysis was performed on the
long-term clinical trial database (almost 600 minutes of recordings) of a
tetraplegic patient executing motor imagery tasks for 3D hand translation. For
a given dataset, the results showed that end-to-end training might not be
significantly better than the hand-crafted features-based model. The
performance gap is reduced with bigger datasets, but considering the increased
computational load, end-to-end training may not be profitable for this
application.
- Abstract(参考訳): 脳信号処理では、ディープラーニング(DL)モデルが一般的に使われている。
しかしながら、従来のmlアプローチと比較してエンド・ツー・エンドのdlモデルによるパフォーマンス向上は通常は重要ではあるが、適度であり、計算負荷の増加と説明可能性の低下のコストがかかる。
ディープラーニングアプローチの背後にある核となるアイデアは、より大きなデータセットによるパフォーマンスのスケールアップだ。
しかし、脳信号は時間的データであり、低信号対雑音比、不確実なラベル、非定常データである。
これらの要因はトレーニングプロセスに影響し、モデルのパフォーマンス向上を遅らせる可能性がある。
これらの要因の影響は、エンドツーエンドのdlモデルと、手作りの機能を使用するモデルで異なる可能性がある。
本稿では,BCIモータ画像復号における生のECoG信号と時間周波数特徴を用いたモデルを比較した。
我々は,現在のデータセットサイズがどのモデルにおいてもより強い制限であるかどうかを考察する。
最後に,手作り特徴の違いを特定するために得られたフィルタを比較し,バックプロパゲーションに最適化した。
両戦略の有効性を比較するために, この課題ですでに有効であることが証明された多層パーセプトロンと畳み込み層とLSTM層を混合した。
本解析は, 四肢麻痺患者の長期臨床試験データベース(約600分記録)を用いて, 3次元手指翻訳のための運動画像タスクを行った。
データセットでは、エンドツーエンドのトレーニングが、手作りの機能ベースモデルよりも大幅に優れているという結果が得られた。
データセットが大きいほどパフォーマンスのギャップは小さくなるが、計算負荷の増加を考えると、エンドツーエンドのトレーニングはこのアプリケーションにとって利益にならないかもしれない。
関連論文リスト
- SONNET: Enhancing Time Delay Estimation by Leveraging Simulated Audio [17.811771707446926]
学習に基づく手法は、合成データにもとづいても、新しい実世界のデータに基づいてGCC-PHATを著しく上回り得ることを示す。
トレーニングされたモデルであるSONNETは、リアルタイムに実行可能で、多くの実データアプリケーションのために、最初から新しいデータに取り組んでいます。
論文 参考訳(メタデータ) (2024-11-20T10:23:21Z) - Evolutionary Retrofitting [42.21143557577615]
AfterLearnERは、完全に訓練された機械学習モデルに進化的手法を含む、微分不可能な最適化を適用することで構成される。
AfterLearnERの効率は、奥行き検知におけるしきい値に基づく基準、音声合成における単語誤り率、3次元生成逆数ネットワーク(GAN)における画像品質といった、識別不能な信号に対処することによって実証される。
AfterLearnERの利点は、その汎用性(グラデーションは必要ない)、人間の評価、限定的なオーバーフィッティング、理論的な研究、そしてその常に振舞いなど、微分不可能なフィードバックを使用することである。
論文 参考訳(メタデータ) (2024-10-15T06:59:32Z) - Reducing Data Bottlenecks in Distributed, Heterogeneous Neural Networks [5.32129361961937]
本稿では,組込みマルチコアおよびマルチコアシステムにおいて,ボトルネックサイズがディープラーニングモデルの性能に与える影響について検討する。
ハードウェア・ソフトウェア共同設計手法を適用し,データトラフィックを減らすため,データボトルネックを極めて狭い層に置き換える。
ハードウェア側の評価では、より高いボトルネック比が、ニューラルネットワークの層間でのデータ転送量を大幅に削減することを示している。
論文 参考訳(メタデータ) (2024-10-12T21:07:55Z) - The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Robust Learning with Progressive Data Expansion Against Spurious
Correlation [65.83104529677234]
本研究では,2層非線形畳み込みニューラルネットワークの学習過程について検討した。
分析の結果,不均衡なデータ群と学習容易なスプリアス特徴が学習過程におけるスプリアス特徴の優位性に繋がる可能性が示唆された。
本稿では,PDEと呼ばれる新たなトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-08T05:44:06Z) - Impact of dataset size and long-term ECoG-based BCI usage on deep
learning decoders performance [4.7773230870500605]
脳-コンピュータインタフェース(BCI)の研究では、記録データは時間がかかり費用がかかる。
デコーダのトレーニングにより多くのデータで高いデコード性能を実現できますか?
実験の後、比較的小さなデータセットで高い復号性能が得られた。
論文 参考訳(メタデータ) (2022-09-08T13:01:05Z) - Decoding ECoG signal into 3D hand translation using deep learning [3.20238141000059]
運動脳-コンピュータインターフェース(Motor Brain-Computer Interface、BCI)は、運動障害者が環境と対話できる技術である。
連続手の動きを予測するために使用されるほとんどのECoG信号デコーダは線形モデルである。
多くの問題において最先端のディープラーニングモデルは、この関係をよりよく捉えるための解決策になり得る。
論文 参考訳(メタデータ) (2021-10-05T15:41:04Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Convolutional Tensor-Train LSTM for Spatio-temporal Learning [116.24172387469994]
本稿では,ビデオシーケンスの長期相関を効率的に学習できる高次LSTMモデルを提案する。
これは、時間をかけて畳み込み特徴を組み合わせることによって予測を行う、新しいテンソルトレインモジュールによって達成される。
この結果は,幅広いアプリケーションやデータセットにおいて,最先端のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-02-21T05:00:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。