論文の概要: Sim-and-Real Reinforcement Learning for Manipulation: A Consensus-based
Approach
- arxiv url: http://arxiv.org/abs/2302.13423v2
- Date: Sun, 17 Sep 2023 12:11:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 00:39:29.639053
- Title: Sim-and-Real Reinforcement Learning for Manipulation: A Consensus-based
Approach
- Title(参考訳): マニピュレーションのためのSim-and-Real Reinforcement Learning: 合意に基づくアプローチ
- Authors: Wenxing Liu, Hanlin Niu, Wei Pan, Guido Herrmann, Joaquin Carrasco
- Abstract要約: マニピュレータのピック・アンド・プレイスタスクのための,コンセンサスに基づくCSAR(Sim-And-Real Deep reinforcement Learning)アルゴリズムを提案する。
我々はシミュレーターと実世界のエージェントを訓練し、シミュレートと実世界の両方の最適なポリシーを得る。
- 参考スコア(独自算出の注目度): 4.684126055213616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sim-and-real training is a promising alternative to sim-to-real training for
robot manipulations. However, the current sim-and-real training is neither
efficient, i.e., slow convergence to the optimal policy, nor effective, i.e.,
sizeable real-world robot data. Given limited time and hardware budgets, the
performance of sim-and-real training is not satisfactory. In this paper, we
propose a Consensus-based Sim-And-Real deep reinforcement learning algorithm
(CSAR) for manipulator pick-and-place tasks, which shows comparable performance
in both sim-and-real worlds. In this algorithm, we train the agents in
simulators and the real world to get the optimal policies for both sim-and-real
worlds. We found two interesting phenomenons: (1) Best policy in simulation is
not the best for sim-and-real training. (2) The more simulation agents, the
better sim-and-real training. The experimental video is available at:
https://youtu.be/mcHJtNIsTEQ.
- Abstract(参考訳): Sim-and-realトレーニングは、ロボット操作のためのsim-to-realトレーニングに代わる有望な代替手段である。
しかし、現在のsim-and-realトレーニングは、最適なポリシーへの収束が遅く、また、実世界の大きさのロボットデータも効率的ではない。
時間とハードウェアの予算が限られているため、sim-and-realトレーニングのパフォーマンスは満足できない。
本稿では,シミュレーションと実世界で同等の性能を示すマニピュレータのピック・アンド・プレースタスクのためのコンセンサスベースsim・アンド・リアル深層強化学習アルゴリズム(csar)を提案する。
このアルゴリズムでは,シミュレーションと実世界のエージェントを訓練し,シミュレーションと実世界の双方の最適なポリシーを得る。
1)シミュレーションにおける最良のポリシーは、シム・アンド・リアルなトレーニングには最適ではない。
2) シミュレーションエージェントが多ければ多いほど,シム・アンド・リアルなトレーニングが向上する。
実験ビデオは、https://youtu.be/mchjtnisteqで見ることができる。
関連論文リスト
- Provable Sim-to-real Transfer in Continuous Domain with Partial
Observations [39.18274543757048]
シン・トゥ・リアル・トランスファー(英語版)は、シミュレーション環境でRLエージェントを訓練し、実世界で展開する。
実環境における最適政策と競合するシミュレートされた環境から、人気のある頑健な対人訓練アルゴリズムが、ポリシーを学習できることを示す。
論文 参考訳(メタデータ) (2022-10-27T16:37:52Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [80.1553611590804]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - Real2Sim or Sim2Real: Robotics Visual Insertion using Deep Reinforcement
Learning and Real2Sim Policy Adaptation [8.992053371569678]
本研究では,最小限のインフラ要件を持つ純粋視覚強化学習ソリューションを用いて挿入課題を解決する。
我々はまた、ポリシー適応において、新しくて簡単なソリューションを提供する新しいsim2real戦略、Real2Simを提案する。
論文 参考訳(メタデータ) (2022-06-06T15:27:25Z) - Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。
最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。
本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文 参考訳(メタデータ) (2021-11-01T13:55:41Z) - Understanding Domain Randomization for Sim-to-real Transfer [41.33483293243257]
本稿では,シミュレータを調整可能なパラメータを持つMDPの集合としてモデル化する,sim-to-realトランスファーの理論的枠組みを提案する。
実世界のトレーニングサンプルを使わずに, 穏やかな条件下で, sim-to-realトランスファーが成功できることを実証する。
論文 参考訳(メタデータ) (2021-10-07T07:45:59Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - A User's Guide to Calibrating Robotics Simulators [54.85241102329546]
本稿では,シミュレーションで学習したモデルやポリシーを現実世界に伝達することを目的とした,様々なアルゴリズムの研究のためのベンチマークとフレームワークを提案する。
我々は、様々なアルゴリズムの性能に関する洞察を特徴付け、提供するために、広く知られたシミュレーション環境の実験を行う。
我々の分析は、この分野の実践者にとって有用であり、sim-to-realアルゴリズムの動作と主特性について、より深い選択をすることができる。
論文 参考訳(メタデータ) (2020-11-17T22:24:26Z) - Reactive Long Horizon Task Execution via Visual Skill and Precondition
Models [59.76233967614774]
シミュレーションで学習したモデルを用いて、単純なタスクプランナの構成要素をグラウンド化することで、見知らぬロボットタスクを達成できるシミュレート・トゥ・リアル・トレーニングのアプローチについて述べる。
シミュレーションでは91.6%から98%,実世界の成功率は10%から80%に増加した。
論文 参考訳(メタデータ) (2020-11-17T15:24:01Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z) - Trade-off on Sim2Real Learning: Real-world Learning Faster than
Simulations [1.949912057689623]
我々は,Deep Bayesian LearningアルゴリズムとモデルのないDRLアルゴリズムを比較し,シミュレーションと実世界の実験から得られた結果を分析した。
SimとReal Learningを検討中,本実験では,計算時間を考慮した場合においても,サンプル効率のよいディープベイズRLの性能がDRLより優れていることを示した。
論文 参考訳(メタデータ) (2020-07-21T09:28:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。