論文の概要: A Novel RL-assisted Deep Learning Framework for Task-informative Signals
Selection and Classification for Spontaneous BCIs
- arxiv url: http://arxiv.org/abs/2007.00162v1
- Date: Wed, 1 Jul 2020 00:35:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 22:36:54.422972
- Title: A Novel RL-assisted Deep Learning Framework for Task-informative Signals
Selection and Classification for Spontaneous BCIs
- Title(参考訳): 自発的bcisのタスクインフォーメーション信号選択と分類のためのrl支援深層学習フレームワーク
- Authors: Wonjun Ko, Eunjin Jeon, and Heung-Il Suk
- Abstract要約: 一つの脳波検定からタスク関連時間信号セグメントを推定・選択する問題を定式化する。
本稿では,既存の深層学習に基づくBCI手法と組み合わせることができる新しい強化学習機構を提案する。
- 参考スコア(独自算出の注目度): 2.299749220980997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we formulate the problem of estimating and selecting
task-relevant temporal signal segments from a single EEG trial in the form of a
Markov decision process and propose a novel reinforcement-learning mechanism
that can be combined with the existing deep-learning based BCI methods. To be
specific, we devise an actor-critic network such that an agent can determine
which timepoints need to be used (informative) or discarded (uninformative) in
composing the intention-related features in a given trial, and thus enhancing
the intention identification performance. To validate the effectiveness of our
proposed method, we conducted experiments with a publicly available big MI
dataset and applied our novel mechanism to various recent deep-learning
architectures designed for MI classification. Based on the exhaustive
experiments, we observed that our proposed method helped achieve statistically
significant improvements in performance.
- Abstract(参考訳): 本研究では,マルコフ決定プロセスの形で,単一の脳波試行からタスク関連時間信号セグメントを推定・選択する問題を定式化し,既存の深層学習に基づくBCI手法と組み合わせることができる新しい強化学習機構を提案する。
具体的には,ある試行において意図的特徴を構成する際に,エージェントがどのタイムポイントを使用するべきか(非形式的)、あるいは(非形式的)に判定し,意図的識別性能を向上させるようにアクタ批判ネットワークを考案する。
提案手法の有効性を検証するために,公開されているbig miデータセットを用いて実験を行い,mi分類用に設計された最近の様々なディープラーニングアーキテクチャに適用した。
実験の結果,提案手法が統計的に有意な性能向上に寄与したことがわかった。
関連論文リスト
- Informed Decision-Making through Advancements in Open Set Recognition and Unknown Sample Detection [0.0]
オープンセット認識(OSR)は、より現実に近い状況に分類タスクを導入することを目的としている。
本研究は,OSRタスクの分類を改善するために,特徴空間の新たな表現を探索するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2024-05-09T15:15:34Z) - Robust Analysis of Multi-Task Learning Efficiency: New Benchmarks on Light-Weighed Backbones and Effective Measurement of Multi-Task Learning Challenges by Feature Disentanglement [69.51496713076253]
本稿では,既存のMTL手法の効率性に焦点をあてる。
バックボーンを小さくしたメソッドの大規模な実験と,MetaGraspNetデータセットを新しいテストグラウンドとして実施する。
また,MTLにおける課題の新規かつ効率的な識別子として,特徴分散尺度を提案する。
論文 参考訳(メタデータ) (2024-02-05T22:15:55Z) - Study Features via Exploring Distribution Structure [9.596923373834093]
本稿では,データセットの確率的モデリングに基づく新しいデータ冗長性測定フレームワークと,ノイズに耐性のある新しい冗長性検出基準を提案する。
我々のフレームワークは柔軟性があり、異なるタイプの機能を扱うことができ、ベンチマークデータセットの実験では、メソッドの有効性が示されています。
論文 参考訳(メタデータ) (2024-01-15T09:01:31Z) - DUCK: Distance-based Unlearning via Centroid Kinematics [40.2428948628001]
本研究は,Centroid Kinematics (DUCK) による遠隔学習(Distance-based Unlearning)と呼ばれる新しいアンラーニングアルゴリズムを導入する。
アルゴリズムの性能評価は、様々なベンチマークデータセットにまたがって行われる。
また,適応学習スコア (Adaptive Unlearning Score, AUS) と呼ばれる新しい指標を導入し, 対象データに対する未学習プロセスの有効性だけでなく, 元のモデルに対する性能損失の定量化も行った。
論文 参考訳(メタデータ) (2023-12-04T17:10:25Z) - Let's reward step by step: Step-Level reward model as the Navigators for
Reasoning [64.27898739929734]
Process-Supervised Reward Model (PRM)は、トレーニングフェーズ中にステップバイステップのフィードバックをLLMに提供する。
LLMの探索経路を最適化するために,PRMからのステップレベルのフィードバックを応用した欲求探索アルゴリズムを提案する。
提案手法の汎用性を探るため,コーディングタスクのステップレベル報酬データセットを自動生成する手法を開発し,コード生成タスクにおける同様の性能向上を観察する。
論文 参考訳(メタデータ) (2023-10-16T05:21:50Z) - Iterative Forward Tuning Boosts In-Context Learning in Language Models [88.25013390669845]
本研究では,大規模言語モデル(LLM)における文脈内学習を促進する新しい2段階フレームワークを提案する。
具体的には、当社のフレームワークでは、ICLプロセスをDeep-ThinkingとTest Stageの2つの別々のステージに分類しています。
ディープシンキング段階にはユニークな注意機構、すなわち反復的な注意強化機構が組み込まれており、複数の情報の蓄積を可能にしている。
論文 参考訳(メタデータ) (2023-05-22T13:18:17Z) - Algorithm Design for Online Meta-Learning with Task Boundary Detection [63.284263611646]
非定常環境におけるタスクに依存しないオンラインメタ学習のための新しいアルゴリズムを提案する。
まず,タスクスイッチと分散シフトの簡易かつ効果的な2つの検出機構を提案する。
軽度条件下では,線形タスク平均的後悔がアルゴリズムに対して達成可能であることを示す。
論文 参考訳(メタデータ) (2023-02-02T04:02:49Z) - MCDAL: Maximum Classifier Discrepancy for Active Learning [74.73133545019877]
近年の最先端のアクティブラーニング手法は, 主にGAN(Generative Adversarial Networks)をサンプル取得に活用している。
本稿では,MCDAL(Maximum Discrepancy for Active Learning)と呼ぶ新しいアクティブラーニングフレームワークを提案する。
特に,両者の差分を最大化することにより,より厳密な決定境界を学習する2つの補助的分類層を利用する。
論文 参考訳(メタデータ) (2021-07-23T06:57:08Z) - SAMBA: Safe Model-Based & Active Reinforcement Learning [59.01424351231993]
SAMBAは、確率論的モデリング、情報理論、統計学といった側面を組み合わせた安全な強化学習のためのフレームワークである。
我々は,低次元および高次元の状態表現を含む安全な力学系ベンチマークを用いて,アルゴリズムの評価を行った。
アクティブなメトリクスと安全性の制約を詳細に分析することで,フレームワークの有効性を直感的に評価する。
論文 参考訳(メタデータ) (2020-06-12T10:40:46Z) - SEKD: Self-Evolving Keypoint Detection and Description [42.114065439674036]
ラベルのない自然画像から高度な局所特徴モデルを学ぶための自己教師型フレームワークを提案する。
提案手法は, ホモグラフィー推定, 相対的なポーズ推定, および動きからの構造的タスクについてベンチマークする。
トレーニングされたモデルとともに、コードを公開します。
論文 参考訳(メタデータ) (2020-06-09T06:56:50Z) - Dynamic Knowledge embedding and tracing [18.717482292051788]
本稿では,行列分解の手法と最近のリカレントニューラルネットワーク(RNN)の進歩を組み合わせた知識追跡手法を提案する。
提案するemphDynEmbフレームワークは,概念やスキルのタグ情報を使わずに,学生の知識の追跡を可能にする。
論文 参考訳(メタデータ) (2020-05-18T21:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。