論文の概要: Multi-Armed Bandits in Brain-Computer Interfaces
- arxiv url: http://arxiv.org/abs/2205.09584v1
- Date: Thu, 19 May 2022 14:24:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-20 21:45:08.617184
- Title: Multi-Armed Bandits in Brain-Computer Interfaces
- Title(参考訳): 脳-コンピュータインタフェースにおけるマルチアーマッドバンド
- Authors: Frida Heskebeck, Carolina Bergeling, Bo Bernhardsson
- Abstract要約: このレビューには、MAB問題と標準解法、およびBCIシステムに関する解釈の背景が含まれている。
それはBCIにおけるMABの最先端の概念と将来の研究への提案を含んでいる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The multi-armed bandit (MAB) problem models a decision-maker that optimizes
its actions based on current and acquired new knowledge to maximize its reward.
This type of online decision is prominent in many procedures of Brain-Computer
Interfaces (BCIs) and MAB has previously been used to investigate, e.g., what
mental commands to use to optimize BCI performance. However, MAB optimization
in the context of BCI is still relatively unexplored, even though it has the
potential to improve BCI performance during both calibration and real-time
implementation. Therefore, this review aims to further introduce MABs to the
BCI community. The review includes a background on MAB problems and standard
solution methods, and interpretations related to BCI systems. Moreover, it
includes state-of-the-art concepts of MAB in BCI and suggestions for future
research.
- Abstract(参考訳): マルチアームバンディット(MAB)問題は、現在の知識に基づいて行動の最適化を行い、報酬を最大化する。
この種のオンライン決定は、BCI(Brain-Computer Interfaces)の多くの手順で顕著であり、MABは以前、BCIのパフォーマンスを最適化するためにどんなメンタルコマンドを使用するかを調べるために用いられてきた。
しかし、キャリブレーションとリアルタイム実装の両方において、BCI性能を改善する可能性があるにもかかわらず、BCIの文脈でのMAB最適化はいまだに未定である。
そこで本稿では,MABをBCIコミュニティにさらに導入することを目的としている。
このレビューには、MAB問題と標準解法、およびBCIシステムに関する解釈の背景が含まれている。
さらに、bciにおけるmabの最先端の概念や今後の研究の提案も含まれている。
関連論文リスト
- Enhancing Multi-Step Reasoning Abilities of Language Models through Direct Q-Function Optimization [50.485788083202124]
強化学習(Reinforcement Learning, RL)は、大規模言語モデルを人間の好みと整合させ、複雑なタスクを遂行する能力を向上させる上で重要な役割を担っている。
反応生成過程をマルコフ決定プロセス(MDP)として定式化し,ソフトアクター・クリティック(SAC)フレームワークを用いて,言語モデルによって直接パラメータ化されたQ関数を最適化する,直接Q関数最適化(DQO)を提案する。
GSM8KとMATHという2つの数学問題解決データセットの実験結果から、DQOは従来の手法よりも優れており、言語モデルを整合させるための有望なオフライン強化学習手法として確立されている。
論文 参考訳(メタデータ) (2024-10-11T23:29:20Z) - Margin Matching Preference Optimization: Enhanced Model Alignment with Granular Feedback [64.67540769692074]
人間のフィードバックからの強化学習など、アライメント技術で微調整された大規模言語モデル(LLM)は、これまでで最も有能なAIシステムの開発に役立っている。
マージンマッチング選好最適化(MMPO)と呼ばれる手法を導入し、相対的な品質マージンを最適化し、LLMポリシーと報酬モデルを改善する。
人間とAIの両方のフィードバックデータによる実験によると、MMPOはMT-benchやRewardBenchといった一般的なベンチマークにおいて、ベースラインメソッドよりも一貫してパフォーマンスが向上している。
論文 参考訳(メタデータ) (2024-10-04T04:56:11Z) - LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning [56.273799410256075]
このフレームワークはMonte Carlo Tree Search (MCTS)と反復的なSelf-Refineを組み合わせて推論パスを最適化する。
このフレームワークは、一般的なベンチマークと高度なベンチマークでテストされており、探索効率と問題解決能力の点で優れた性能を示している。
論文 参考訳(メタデータ) (2024-10-03T18:12:29Z) - MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.20845457594977]
大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文 参考訳(メタデータ) (2024-06-20T03:50:23Z) - Exploring new territory: Calibration-free decoding for c-VEP BCI [0.0]
本研究では,脳-コンピュータインタフェース(BCI)のユーザビリティ向上を目的とした2つのゼロトレーニング手法について検討する。
事象関連電位(ERP)領域に根ざした新しい手法,unsupervised mean(UMM)を導入する。
正準相関解析(CCA)を用いた最先端のC-VEPゼロトレーニング法と比較する。
論文 参考訳(メタデータ) (2024-03-22T13:20:33Z) - Reinforced In-Context Black-Box Optimization [64.25546325063272]
RIBBOは、オフラインデータからエンドツーエンドでBBOアルゴリズムを強化学習する手法である。
RIBBOは、複数の動作アルゴリズムとタスクによって生成される最適化履歴を学習するために、表現的なシーケンスモデルを使用している。
提案手法の中心となるのは,テキストレグレット・ツー・ゴートークンによる最適化履歴の増大である。
論文 参考訳(メタデータ) (2024-02-27T11:32:14Z) - Learning to Optimize Resource Assignment for Task Offloading in Mobile
Edge Computing [35.69975917554333]
深層学習(DL)を適用した知的BnB(IBnB)アプローチを提案し,BnBアプローチの刈り取り戦略を学習する。
この学習手法を用いることで、BnBアプローチの構造は、ほぼ最適性能を保証し、DLベースのプルーニング戦略は複雑さを著しく低減する。
論文 参考訳(メタデータ) (2022-03-15T10:17:29Z) - Minimizing subject-dependent calibration for BCI with Riemannian
transfer learning [0.8399688944263843]
異なる被験者から記録されたデータに基づいて分類器を訓練し、良好な性能を保ちながら校正を減らそうとする手法を提案する。
このアプローチの堅牢性を示すために,3つのBCIパラダイムに対して,複数のデータセットのメタ分析を行った。
論文 参考訳(メタデータ) (2021-11-23T18:37:58Z) - Value-Function-based Sequential Minimization for Bi-level Optimization [52.39882976848064]
勾配に基づくBi-Level Optimization (BLO)法は、現代の学習課題に広く応用されている。
機能的制約のあるBLOや悲観的なBLOなど、難解なシナリオでBLOを解くことができる勾配ベースの方法はほとんどない。
上記の問題に対処するために,BVFSM(Bi-level Value-Function-based Sequential Minimization)を提案する。
論文 参考訳(メタデータ) (2021-10-11T03:13:39Z) - An Improved BAT Algorithm for Solving Job Scheduling Problems in Hotels
and Restaurants [12.641474799416772]
Batアルゴリズム(BA)は、Swarmインテリジェンスファミリーのメタヒューリスティックアルゴリズムの一般的な例である。
本稿では,コンバージェンスを高速化し,大規模アプリケーションでより実用的な手法を実現するため,オリジナルのBAの改良を行った。
改造BAはホテルやレストランの実際のジョブスケジューリング問題を解決するために適用された。
論文 参考訳(メタデータ) (2021-07-25T09:46:52Z) - MIN2Net: End-to-End Multi-Task Learning for Subject-Independent Motor
Imagery EEG Classification [10.773708402778025]
脳波のリズムは被験者に特有のものであり、時間とともに様々な変化が起こる。
本稿では,この課題に対処するための新しいエンドツーエンドマルチタスク学習であるMIN2Netを提案する。
深層学習をマルチタスクオートエンコーダに統合し,脳波からコンパクトかつ識別可能な潜在表現を学習する。
論文 参考訳(メタデータ) (2021-02-07T15:20:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。