論文の概要: RMBench: Benchmarking Deep Reinforcement Learning for Robotic
Manipulator Control
- arxiv url: http://arxiv.org/abs/2210.11262v1
- Date: Thu, 20 Oct 2022 13:34:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 15:34:25.984745
- Title: RMBench: Benchmarking Deep Reinforcement Learning for Robotic
Manipulator Control
- Title(参考訳): RMBench:ロボットマニピュレータ制御のための深部強化学習ベンチマーク
- Authors: Yanfei Xiang, Xin Wang, Shu Hu, Bin Zhu, Xiaomeng Huang, Xi Wu, Siwei
Lyu
- Abstract要約: 強化学習は、高次元の感覚入力から実際の複雑なタスクを解決するために応用される。
生の知覚信号表現における深層学習の最近の進歩
ロボット操作のための最初のベンチマークであるRMBenchを紹介する。
- 参考スコア(独自算出の注目度): 47.61691569074207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning is applied to solve actual complex tasks from
high-dimensional, sensory inputs. The last decade has developed a long list of
reinforcement learning algorithms. Recent progress benefits from deep learning
for raw sensory signal representation. One question naturally arises: how well
do they perform concerning different robotic manipulation tasks? Benchmarks use
objective performance metrics to offer a scientific way to compare algorithms.
In this paper, we present RMBench, the first benchmark for robotic
manipulations, which have high-dimensional continuous action and state spaces.
We implement and evaluate reinforcement learning algorithms that directly use
observed pixels as inputs. We report their average performance and learning
curves to show their performance and stability of training. Our study concludes
that none of the studied algorithms can handle all tasks well, soft
Actor-Critic outperforms most algorithms in average reward and stability, and
an algorithm combined with data augmentation may facilitate learning policies.
Our code is publicly available at
https://anonymous.4open.science/r/RMBench-2022-3424, including all benchmark
tasks and studied algorithms.
- Abstract(参考訳): 強化学習は、高次元の感覚入力から実際の複雑なタスクを解決するために用いられる。
過去10年間、強化学習アルゴリズムの長いリストが開発された。
生の知覚信号表現における深層学習の最近の進歩
ロボット操作のさまざまなタスクに対して、どの程度うまく機能するのか?
ベンチマークは客観的パフォーマンスメトリクスを使用して、アルゴリズムを比較する科学的方法を提供する。
本稿では,ロボット操作のための最初のベンチマークであるRMBenchについて述べる。
観測画素を直接入力として使用する強化学習アルゴリズムを実装し,評価する。
平均的な成績と学習曲線を報告し,トレーニングのパフォーマンスと安定性を示す。
我々の研究は、研究対象のアルゴリズムはどれも全てのタスクをうまく処理することができず、ソフトアクター・クリティカルは平均的な報酬と安定性でほとんどのアルゴリズムより優れており、データ拡張と組み合わせたアルゴリズムは学習ポリシーを促進する可能性があると結論付けている。
私たちのコードはhttps://anonymous.4open.science/r/RMBench-2022-3424で公開されています。
関連論文リスト
- Reinforcement Learning with Action Sequence for Data-Efficient Robot Learning [62.3886343725955]
本稿では,行動列上のQ値を出力する批判ネットワークを学習する新しいRLアルゴリズムを提案する。
提案アルゴリズムは,現在および将来の一連の行動の実行結果を学習するために値関数を明示的に訓練することにより,ノイズのある軌道から有用な値関数を学習することができる。
論文 参考訳(メタデータ) (2024-11-19T01:23:52Z) - A Comparison of Imitation Learning Algorithms for Bimanual Manipulation [22.531439806919547]
本研究では,顕著な模倣学習アプローチの限界とメリットを実証する。
我々は,過剰制約付き力学系を含む複雑な双方向操作タスクにおいて,それぞれのアルゴリズムを評価する。
模倣学習は複雑なタスクを解くのに適しているが、全てのアルゴリズムが摂動、トレーニング要件、パフォーマンス、使いやすさに等しいわけではない。
論文 参考訳(メタデータ) (2024-08-13T00:04:17Z) - Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - A Generalist Neural Algorithmic Learner [18.425083543441776]
我々は、幅広いアルゴリズムを実行することを学習できる単一のグラフニューラルネットワークプロセッサを構築している。
マルチタスク方式でアルゴリズムを効果的に学習できることを示す。
論文 参考訳(メタデータ) (2022-09-22T16:41:33Z) - The CLRS Algorithmic Reasoning Benchmark [28.789225199559834]
アルゴリズムの学習表現は機械学習の新たな領域であり、ニューラルネットワークから古典的なアルゴリズムで概念をブリッジしようとしている。
本稿では,従来のアルゴリズムを包括するCLRS Algorithmic Reasoning Benchmarkを提案する。
我々のベンチマークは、ソート、探索、動的プログラミング、グラフアルゴリズム、文字列アルゴリズム、幾何アルゴリズムなど、様々なアルゴリズムの推論手順にまたがっている。
論文 参考訳(メタデータ) (2022-05-31T09:56:44Z) - Benchmarking Processor Performance by Multi-Threaded Machine Learning
Algorithms [0.0]
本稿では,マルチスレッド機械学習クラスタリングアルゴリズムの性能比較を行う。
私は、アルゴリズムのパフォーマンス特性を決定するために、線形回帰、ランダムフォレスト、K-Nearest Neighborsに取り組んでいます。
論文 参考訳(メタデータ) (2021-09-11T13:26:58Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - A Framework for Efficient Robotic Manipulation [79.10407063260473]
単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。
デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
論文 参考訳(メタデータ) (2020-12-14T22:18:39Z) - Mastering Rate based Curriculum Learning [78.45222238426246]
学習の進行という概念には、学習者のサンプル効率の低下につながるいくつかの欠点があると主張する。
本稿では,習得率の概念に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-14T16:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。