論文の概要: On the Role of the Action Space in Robot Manipulation Learning and Sim-to-Real Transfer
- arxiv url: http://arxiv.org/abs/2312.03673v2
- Date: Mon, 29 Apr 2024 18:11:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-01 19:37:57.177779
- Title: On the Role of the Action Space in Robot Manipulation Learning and Sim-to-Real Transfer
- Title(参考訳): ロボットマニピュレーション学習と情報伝達における行動空間の役割について
- Authors: Elie Aljalbout, Felix Frank, Maximilian Karl, Patrick van der Smagt,
- Abstract要約: 本研究では,ロボット操作学習とシミュレート・トゥ・リアル・トランスファーにおける行動空間の選択について検討する。
我々は250以上の強化学習(RL)エージェントを訓練し、タスクの到達とプッシュをシミュレートした。
空間の選択は、共通のアクション空間設計特性の組み合わせにまたがる。
- 参考スコア(独自算出の注目度): 6.1622717998840395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the choice of action space in robot manipulation learning and sim-to-real transfer. We define metrics that assess the performance, and examine the emerging properties in the different action spaces. We train over 250 reinforcement learning~(RL) agents in simulated reaching and pushing tasks, using 13 different control spaces. The choice of spaces spans combinations of common action space design characteristics. We evaluate the training performance in simulation and the transfer to a real-world environment. We identify good and bad characteristics of robotic action spaces and make recommendations for future designs. Our findings have important implications for the design of RL algorithms for robot manipulation tasks, and highlight the need for careful consideration of action spaces when training and transferring RL agents for real-world robotics.
- Abstract(参考訳): 本研究では,ロボット操作学習とシミュレート・トゥ・リアル・トランスファーにおける行動空間の選択について検討する。
我々は、パフォーマンスを評価するメトリクスを定義し、異なるアクション空間における出現する特性について検討する。
我々は、13の異なる制御空間を用いて、250以上の強化学習〜(RL)エージェントをシミュレートされたリーチおよびプッシュタスクで訓練する。
空間の選択は、共通のアクション空間設計特性の組み合わせにまたがる。
シミュレーションにおけるトレーニング性能の評価と実環境への移行について検討した。
ロボット行動空間の良質な特徴と悪質な特徴を特定し,今後の設計を推奨する。
本研究は,ロボット操作タスクにおけるRLアルゴリズムの設計に重要な意味を持ち,実世界のロボット工学におけるRLエージェントのトレーニングおよび転送において,アクション空間の注意深い検討の必要性を強調した。
関連論文リスト
- Redundancy-aware Action Spaces for Robot Learning [17.961314026588987]
共同空間制御とタスク空間制御は、ロボット学習文学におけるロボットアームを制御する2つの主要な動作モードである。
本研究では,ロボット操作のためのアクション空間の設計基準を分析し,新しいアクション空間の定式化であるER(End-effector Redundancy)を導入する。
本稿では,ERAngle (ERA) とERJoint (ERJ) の2つの実装について述べる。
論文 参考訳(メタデータ) (2024-06-06T15:08:41Z) - Cross-Embodiment Robot Manipulation Skill Transfer using Latent Space Alignment [24.93621734941354]
本稿では,形態の異なるロボットマニピュレータ間の制御ポリシの伝達に着目した。
主要な洞察は、ソースとターゲットロボットの状態と行動空間を共通の潜在空間表現に投影することである。
我々は、異なる状態、行動、実施形態のソースとターゲットロボットによるシム・トゥ・シム・トゥ・シム・トゥ・シム・トゥ・リアルな操作ポリシーの伝達を実証する。
論文 参考訳(メタデータ) (2024-06-04T05:00:24Z) - Unsupervised Learning of Effective Actions in Robotics [0.9374652839580183]
ロボット工学における現在の最先端のアクション表現は、ロボットのアクションに対する適切な効果駆動学習を欠いている。
連続運動空間の離散化と「アクションプロトタイプ」生成のための教師なしアルゴリズムを提案する。
シミュレーションされた階段登上補強学習課題について,本手法の評価を行った。
論文 参考訳(メタデータ) (2024-04-03T13:28:52Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - Bi-Manual Block Assembly via Sim-to-Real Reinforcement Learning [24.223788665601678]
2つのxArm6ロボットがU字型組立タスクを、シミュレーションで90%以上、実際のハードウェアで50%の確率で解決する。
以上の結果から,本システムは今後,深部RLおよびSim2Real転送バイマニュアルポリアの研究を刺激していきたいと願っている。
論文 参考訳(メタデータ) (2023-03-27T01:25:24Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Accelerating Robotic Reinforcement Learning via Parameterized Action
Primitives [92.0321404272942]
強化学習は汎用ロボットシステムの構築に使用することができる。
しかし、ロボット工学の課題を解決するためにRLエージェントを訓練することは依然として困難である。
本研究では,ロボット行動プリミティブ(RAPS)のライブラリを手動で指定し,RLポリシーで学習した引数をパラメータ化する。
動作インターフェースへの簡単な変更は、学習効率とタスクパフォーマンスの両方を大幅に改善する。
論文 参考訳(メタデータ) (2021-10-28T17:59:30Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z) - SAPIEN: A SimulAted Part-based Interactive ENvironment [77.4739790629284]
SAPIENは現実的で物理に富んだシミュレートされた環境であり、音声オブジェクトのための大規模なセットをホストしている。
部品検出と動作特性認識のための最先端の視覚アルゴリズムの評価を行い,ロボットインタラクションタスクの実証を行った。
論文 参考訳(メタデータ) (2020-03-19T00:11:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。