論文の概要: A survey of benchmarking frameworks for reinforcement learning
- arxiv url: http://arxiv.org/abs/2011.13577v1
- Date: Fri, 27 Nov 2020 06:32:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 02:41:23.055275
- Title: A survey of benchmarking frameworks for reinforcement learning
- Title(参考訳): 強化学習のためのベンチマークフレームワークの調査
- Authors: Belinda Stapelberg and Katherine M. Malan
- Abstract要約: 本稿では,強化学習ベンチマークへの様々な貢献について概説する。
論文の中では最もよく使われ、近年でも研究が進められている。
この調査は、利用可能な幅広い強化学習ベンチマークタスクに注意を向けることを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Reinforcement learning has recently experienced increased prominence in the
machine learning community. There are many approaches to solving reinforcement
learning problems with new techniques developed constantly. When solving
problems using reinforcement learning, there are various difficult challenges
to overcome. To ensure progress in the field, benchmarks are important for
testing new algorithms and comparing with other approaches. The reproducibility
of results for fair comparison is therefore vital in ensuring that improvements
are accurately judged. This paper provides an overview of different
contributions to reinforcement learning benchmarking and discusses how they can
assist researchers to address the challenges facing reinforcement learning. The
contributions discussed are the most used and recent in the literature. The
paper discusses the contributions in terms of implementation, tasks and
provided algorithm implementations with benchmarks. The survey aims to bring
attention to the wide range of reinforcement learning benchmarking tasks
available and to encourage research to take place in a standardised manner.
Additionally, this survey acts as an overview for researchers not familiar with
the different tasks that can be used to develop and test new reinforcement
learning algorithms.
- Abstract(参考訳): 強化学習は最近、機械学習コミュニティで注目を集めている。
新しい手法が絶えず開発され、強化学習問題を解決する多くのアプローチがある。
強化学習を用いた問題解決には,克服すべき課題がいろいろある。
この分野の進歩を保証するため、ベンチマークは新しいアルゴリズムのテストや他のアプローチとの比較に重要である。
したがって、公正な比較のための結果の再現性は、改善を正確に判断する上で不可欠である。
本稿では、強化学習ベンチマークへの様々な貢献の概要と、強化学習が直面する課題に研究者がどう対処できるかについて論じる。
論文の中では最もよく使われ、近年でも研究が進められている。
本稿では,ベンチマークを用いた実装,タスク,アルゴリズム実装の面での貢献について述べる。
この調査は、利用可能な幅広い強化学習ベンチマークタスクに注意を向け、標準化された方法で研究を奨励することを目的としている。
さらに、この調査は、新しい強化学習アルゴリズムの開発とテストに使用できる様々なタスクに慣れていない研究者の概観として機能する。
関連論文リスト
- Sharing Knowledge in Multi-Task Deep Reinforcement Learning [57.38874587065694]
マルチタスク強化学習において、ディープニューラルネットワークを効果的に活用するためのタスク間の表現の共有の利点について検討する。
我々は,タスク間で表現を共有するのに便利な条件を強調する理論的保証を提供することで,これを証明している。
論文 参考訳(メタデータ) (2024-01-17T19:31:21Z) - Self-paced Weight Consolidation for Continual Learning [39.27729549041708]
連続学習アルゴリズムは、逐次的なタスク学習設定における破滅的な忘れ込みを防ぐのに人気がある。
継続学習を実現するために,自己ペーストウェイト統合(spWC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-20T13:07:41Z) - Causal Reinforcement Learning: A Survey [57.368108154871]
強化学習は、不確実性の下でのシーケンシャルな決定問題の解決に不可欠なパラダイムである。
主な障害の1つは、強化学習エージェントが世界に対する根本的な理解を欠いていることである。
因果性は、体系的な方法で知識を形式化できるという点で顕著な利点がある。
論文 参考訳(メタデータ) (2023-07-04T03:00:43Z) - GLUECons: A Generic Benchmark for Learning Under Constraints [102.78051169725455]
本研究では,自然言語処理とコンピュータビジョンの分野における9つのタスクの集合であるベンチマークを作成する。
外部知識を制約としてモデル化し、各タスクの制約のソースを特定し、これらの制約を使用するさまざまなモデルを実装します。
論文 参考訳(メタデータ) (2023-02-16T16:45:36Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - Evaluation Methods and Measures for Causal Learning Algorithms [33.07234268724662]
我々は2つの基本的な因果推論タスクと因果認識機械学習タスクに焦点を当てる。
この調査は、公開可能なベンチマークの開発と、観察データによる因果学習評価のためのコンセンサス標準の策定の緊急性に先んじることを目指している。
論文 参考訳(メタデータ) (2022-02-07T00:24:34Z) - Rethinking Learning Dynamics in RL using Adversarial Networks [79.56118674435844]
本稿では,スキル埋め込み空間を通じてパラメータ化された,密接に関連するスキルの強化学習のための学習機構を提案する。
本研究の主な貢献は、エントロピー規則化政策勾配定式化の助けを借りて、強化学習のための敵の訓練体制を定式化することである。
論文 参考訳(メタデータ) (2022-01-27T19:51:09Z) - KnowRU: Knowledge Reusing via Knowledge Distillation in Multi-agent
Reinforcement Learning [16.167201058368303]
深層強化学習(RL)アルゴリズムはマルチエージェント領域において劇的に進歩している。
この問題を解決するには、歴史的経験の効率的な活用が不可欠です。
知識再利用のための「KnowRU」という手法を提案する。
論文 参考訳(メタデータ) (2021-03-27T12:38:01Z) - Transfer Learning in Deep Reinforcement Learning: A Survey [64.36174156782333]
強化学習は、シーケンシャルな意思決定問題を解決するための学習パラダイムである。
近年、ディープニューラルネットワークの急速な発展により、強化学習の顕著な進歩が見られた。
転校学習は 強化学習が直面する様々な課題に 対処するために生まれました
論文 参考訳(メタデータ) (2020-09-16T18:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。