Fugu-MT 論文翻訳(概要): RMBench: Benchmarking Deep Reinforcement Learning for Robotic Manipulator Control

論文の概要: RMBench: Benchmarking Deep Reinforcement Learning for Robotic Manipulator Control

arxiv url: http://arxiv.org/abs/2210.11262v1
Date: Thu, 20 Oct 2022 13:34:26 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-21 15:34:25.984745
Title: RMBench: Benchmarking Deep Reinforcement Learning for Robotic Manipulator Control
Title（参考訳）: RMBench:ロボットマニピュレータ制御のための深部強化学習ベンチマーク
Authors: Yanfei Xiang, Xin Wang, Shu Hu, Bin Zhu, Xiaomeng Huang, Xi Wu, Siwei Lyu
Abstract要約: 強化学習は、高次元の感覚入力から実際の複雑なタスクを解決するために応用される。生の知覚信号表現における深層学習の最近の進歩ロボット操作のための最初のベンチマークであるRMBenchを紹介する。
参考スコア（独自算出の注目度）: 47.61691569074207
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Reinforcement learning is applied to solve actual complex tasks from high-dimensional, sensory inputs. The last decade has developed a long list of reinforcement learning algorithms. Recent progress benefits from deep learning for raw sensory signal representation. One question naturally arises: how well do they perform concerning different robotic manipulation tasks? Benchmarks use objective performance metrics to offer a scientific way to compare algorithms. In this paper, we present RMBench, the first benchmark for robotic manipulations, which have high-dimensional continuous action and state spaces. We implement and evaluate reinforcement learning algorithms that directly use observed pixels as inputs. We report their average performance and learning curves to show their performance and stability of training. Our study concludes that none of the studied algorithms can handle all tasks well, soft Actor-Critic outperforms most algorithms in average reward and stability, and an algorithm combined with data augmentation may facilitate learning policies. Our code is publicly available at https://anonymous.4open.science/r/RMBench-2022-3424, including all benchmark tasks and studied algorithms.
Abstract（参考訳）: 強化学習は、高次元の感覚入力から実際の複雑なタスクを解決するために用いられる。過去10年間、強化学習アルゴリズムの長いリストが開発された。生の知覚信号表現における深層学習の最近の進歩ロボット操作のさまざまなタスクに対して、どの程度うまく機能するのか? ベンチマークは客観的パフォーマンスメトリクスを使用して、アルゴリズムを比較する科学的方法を提供する。本稿では,ロボット操作のための最初のベンチマークであるRMBenchについて述べる。観測画素を直接入力として使用する強化学習アルゴリズムを実装し,評価する。平均的な成績と学習曲線を報告し,トレーニングのパフォーマンスと安定性を示す。我々の研究は、研究対象のアルゴリズムはどれも全てのタスクをうまく処理することができず、ソフトアクター・クリティカルは平均的な報酬と安定性でほとんどのアルゴリズムより優れており、データ拡張と組み合わせたアルゴリズムは学習ポリシーを促進する可能性があると結論付けている。私たちのコードはhttps://anonymous.4open.science/r/RMBench-2022-3424で公開されています。

関連論文リスト

Simulation-Aided Policy Tuning for Black-Box Robot Learning [47.83474891747279]
本稿では,データ効率の向上に着目した新しいブラックボックスポリシー探索アルゴリズムを提案する。このアルゴリズムはロボット上で直接学習し、シミュレーションを追加の情報源として扱い、学習プロセスを高速化する。ロボットマニピュレータ上でのタスク学習の高速化と成功を,不完全なシミュレータの助けを借りて示す。
論文参考訳（メタデータ） (2024-11-21T15:52:23Z)
Reinforcement Learning with Action Sequence for Data-Efficient Robot Learning [62.3886343725955]
本稿では,行動列上のQ値を出力する批判ネットワークを学習する新しいRLアルゴリズムを提案する。提案アルゴリズムは,現在および将来の一連の行動の実行結果を学習するために値関数を明示的に訓練することにより,ノイズのある軌道から有用な値関数を学習することができる。
論文参考訳（メタデータ） (2024-11-19T01:23:52Z)
A Comparison of Imitation Learning Algorithms for Bimanual Manipulation [22.531439806919547]
本研究では,顕著な模倣学習アプローチの限界とメリットを実証する。我々は,過剰制約付き力学系を含む複雑な双方向操作タスクにおいて,それぞれのアルゴリズムを評価する。模倣学習は複雑なタスクを解くのに適しているが、全てのアルゴリズムが摂動、トレーニング要件、パフォーマンス、使いやすさに等しいわけではない。
論文参考訳（メタデータ） (2024-08-13T00:04:17Z)
Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。 GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文参考訳（メタデータ） (2024-07-22T06:12:21Z)
A Generalist Neural Algorithmic Learner [18.425083543441776]
我々は、幅広いアルゴリズムを実行することを学習できる単一のグラフニューラルネットワークプロセッサを構築している。マルチタスク方式でアルゴリズムを効果的に学習できることを示す。
論文参考訳（メタデータ） (2022-09-22T16:41:33Z)
The CLRS Algorithmic Reasoning Benchmark [28.789225199559834]
アルゴリズムの学習表現は機械学習の新たな領域であり、ニューラルネットワークから古典的なアルゴリズムで概念をブリッジしようとしている。本稿では,従来のアルゴリズムを包括するCLRS Algorithmic Reasoning Benchmarkを提案する。我々のベンチマークは、ソート、探索、動的プログラミング、グラフアルゴリズム、文字列アルゴリズム、幾何アルゴリズムなど、様々なアルゴリズムの推論手順にまたがっている。
論文参考訳（メタデータ） (2022-05-31T09:56:44Z)
Benchmarking Processor Performance by Multi-Threaded Machine Learning Algorithms [0.0]
本稿では,マルチスレッド機械学習クラスタリングアルゴリズムの性能比較を行う。私は、アルゴリズムのパフォーマンス特性を決定するために、線形回帰、ランダムフォレスト、K-Nearest Neighborsに取り組んでいます。
論文参考訳（メタデータ） (2021-09-11T13:26:58Z)
Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文参考訳（メタデータ） (2021-01-08T18:55:07Z)
A Framework for Efficient Robotic Manipulation [79.10407063260473]
単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
論文参考訳（メタデータ） (2020-12-14T22:18:39Z)
Mastering Rate based Curriculum Learning [78.45222238426246]
学習の進行という概念には、学習者のサンプル効率の低下につながるいくつかの欠点があると主張する。本稿では,習得率の概念に基づく新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-08-14T16:34:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。