論文の概要: Learning Design and Construction with Varying-Sized Materials via
Prioritized Memory Resets
- arxiv url: http://arxiv.org/abs/2204.05509v1
- Date: Tue, 12 Apr 2022 03:45:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-14 02:08:10.774820
- Title: Learning Design and Construction with Varying-Sized Materials via
Prioritized Memory Resets
- Title(参考訳): 優先順位付けメモリリセットによる教材の学習設計と構成
- Authors: Yunfei Li, Tao Kong, Lei Li and Yi Wu
- Abstract要約: ロボットは、ブループリントなしで、さまざまなサイズのブロックから橋の設計と構築を自律的に学べるだろうか?
ロボットは、ブロックの操作と輸送のために、物理的に安定した設計スキームと実行可能なアクションを見つけなければならない。
本稿では,高レベルの建築指示を提案する強化学習設計者と,低レベルのブロックを操作する動作計画に基づくアクションジェネレータからなる,この問題に対する階層的アプローチを提案する。
- 参考スコア(独自算出の注目度): 30.993174896902357
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Can a robot autonomously learn to design and construct a bridge from
varying-sized blocks without a blueprint? It is a challenging task with long
horizon and sparse reward -- the robot has to figure out physically stable
design schemes and feasible actions to manipulate and transport blocks. Due to
diverse block sizes, the state space and action trajectories are vast to
explore. In this paper, we propose a hierarchical approach for this problem. It
consists of a reinforcement-learning designer to propose high-level building
instructions and a motion-planning-based action generator to manipulate blocks
at the low level. For high-level learning, we develop a novel technique,
prioritized memory resetting (PMR) to improve exploration. PMR adaptively
resets the state to those most critical configurations from a replay buffer so
that the robot can resume training on partial architectures instead of from
scratch. Furthermore, we augment PMR with auxiliary training objectives and
fine-tune the designer with the locomotion generator. Our experiments in
simulation and on a real deployed robotic system demonstrate that it is able to
effectively construct bridges with blocks of varying sizes at a high success
rate. Demos can be found at https://sites.google.com/view/bridge-pmr.
- Abstract(参考訳): ロボットは、ブループリントなしで、さまざまなサイズのブロックから橋の設計と構築を自律的に学べるだろうか?
ロボットは、ブロックを操作して輸送するために、物理的に安定した設計スキームと実行可能なアクションを見つけなければならない。
ブロックサイズが多様であるため、状態空間と行動軌道は探索に広く用いられる。
本稿では,この問題に対する階層的アプローチを提案する。
高いレベルの建築指示を提案する強化学習デザイナと、低レベルのブロックを操作するモーションプランニングベースのアクションジェネレータで構成されている。
高レベルの学習のために,探索を改善するためにメモリリセット(PMR)を優先する新しい手法を開発した。
pmrは状態をリプレイバッファから最も重要な設定に適応的にリセットするので、ロボットはスクラッチではなく部分的なアーキテクチャのトレーニングを再開できる。
さらに,補助訓練目標でpmrを補強し,ロコモーション発生器で設計者を微調整する。
シミュレーションと実際のロボットシステムによる実験により,異なる大きさのブロックを有する橋を,高い成功率で効果的に構築できることを実証した。
デモはhttps://sites.google.com/view/bridge-pmrで見ることができる。
関連論文リスト
- RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Tiny Reinforcement Learning for Quadruped Locomotion using Decision
Transformers [0.9217021281095907]
リソース制約のあるロボットプラットフォームは、低コストのハードウェア代替品を必要とするタスクに役立ちます。
本稿では,資源制約のあるロボットプラットフォーム上での模倣学習を実現する手法を提案する。
本手法は資源制約された四足歩行ロボットであるBittleの自然視運動を実現する。
論文 参考訳(メタデータ) (2024-02-20T18:10:39Z) - RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning
via Generative Simulation [64.51563634951394]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Not Only Rewards But Also Constraints: Applications on Legged Robot
Locomotion [2.8217421869436126]
本稿では,報酬と制約の両方からなる複雑なロボットシステムのためのニューラルネットワークコントローラをトレーニングするための,新しい強化学習フレームワークを提案する。
学習フレームワークは、異なる形態と物理的特性を持つ複数の脚を持つロボットのトレーニングコントローラに適用され、困難な地形を横断する。
論文 参考訳(メタデータ) (2023-08-24T03:06:20Z) - Robot Learning with Sensorimotor Pre-training [98.7755895548928]
ロボット工学のための自己教師型感覚運動器事前学習手法を提案する。
我々のモデルはRTTと呼ばれ、センサモレータトークンのシーケンスで動作するトランスフォーマーである。
感覚運動の事前学習は、ゼロからトレーニングを一貫して上回り、優れたスケーリング特性を持ち、さまざまなタスク、環境、ロボット間での移動を可能にしている。
論文 参考訳(メタデータ) (2023-06-16T17:58:10Z) - Pave the Way to Grasp Anything: Transferring Foundation Models for
Universal Pick-Place Robots [50.73735524550534]
そこで本稿では,最先端基礎モデルによって生成された言語基底セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
マスクから伝達される正確なセマンティクスとジオメトリを多視点ポリシーモデルに統合することにより、正確なオブジェクトのポーズを認識し、サンプル効率のよい学習を可能にする。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Obstacle Avoidance for Robotic Manipulator in Joint Space via Improved
Proximal Policy Optimization [6.067589886362815]
本稿では,6-DoFマニピュレータのタスク空間から関節空間にマップするために,改良されたPPOアルゴリズムを用いて深層ニューラルネットワークを訓練する。
実ロボットでそのようなタスクを訓練するのは時間を要するので、モデルを訓練するためのシミュレーション環境を開発する。
実験結果から,ロボットは非構造環境下で1つの目標をトラッキングしたり,複数の目標に到達することができた。
論文 参考訳(メタデータ) (2022-10-03T10:21:57Z) - Learning to Design and Construct Bridge without Blueprint [20.524052738716435]
ブループリントを使わずに橋を設計・構築する,新しい難易度組立作業について検討する。
この作業では,まず任意に広い崖の橋梁構造を設計し,そのブロックを確実に操作し,提案した設計に従って安定な橋梁を構築する必要がある。
高レベルでは、深層強化学習とカリキュラム学習を用いて、物理シミュレータでブリッジブループリントポリシーを学習する。
低レベル制御のために、実世界の橋梁構築のための訓練された青写真ポリシーと直接結合できる実ロボットモーション制御のためのモーションプランニングベースのポリシーを実装した。
論文 参考訳(メタデータ) (2021-08-05T08:17:22Z) - Deep Imitation Learning for Bimanual Robotic Manipulation [70.56142804957187]
本稿では,ロボットによるバイマニュアル操作のための深層模倣学習フレームワークを提案する。
中心となる課題は、操作スキルを異なる場所にあるオブジェクトに一般化することである。
i)マルチモーダルダイナミクスを要素運動プリミティブに分解し、(ii)リカレントグラフニューラルネットワークを用いて各プリミティブをパラメータ化して相互作用を捕捉し、(iii)プリミティブを逐次的に構成する高レベルプランナと、プリミティブダイナミクスと逆運動学制御を組み合わせた低レベルコントローラを統合することを提案する。
論文 参考訳(メタデータ) (2020-10-11T01:40:03Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - Imitation Learning for Autonomous Trajectory Learning of Robot Arms in
Space [13.64392246529041]
実演や模倣学習によるプログラミングの概念は、小型宇宙船に搭載されたマニピュレータの軌道計画に使用される。
7自由度(DoF)を持つロボットアームは、将来の宇宙ミッションにおける自律性の向上と地上制御による人間の介入の最小化のために、デブリ除去、軌道上サービス、組み立てといった複数のタスクを実行するために構想されている。
論文 参考訳(メタデータ) (2020-08-10T10:18:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。