Fugu-MT 論文翻訳(概要): Learning Design and Construction with Varying-Sized Materials via Prioritized Memory Resets

論文の概要: Learning Design and Construction with Varying-Sized Materials via Prioritized Memory Resets

arxiv url: http://arxiv.org/abs/2204.05509v1
Date: Tue, 12 Apr 2022 03:45:48 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-14 02:08:10.774820
Title: Learning Design and Construction with Varying-Sized Materials via Prioritized Memory Resets
Title（参考訳）: 優先順位付けメモリリセットによる教材の学習設計と構成
Authors: Yunfei Li, Tao Kong, Lei Li and Yi Wu
Abstract要約: ロボットは、ブループリントなしで、さまざまなサイズのブロックから橋の設計と構築を自律的に学べるだろうか? ロボットは、ブロックの操作と輸送のために、物理的に安定した設計スキームと実行可能なアクションを見つけなければならない。本稿では,高レベルの建築指示を提案する強化学習設計者と,低レベルのブロックを操作する動作計画に基づくアクションジェネレータからなる,この問題に対する階層的アプローチを提案する。
参考スコア（独自算出の注目度）: 30.993174896902357
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Can a robot autonomously learn to design and construct a bridge from varying-sized blocks without a blueprint? It is a challenging task with long horizon and sparse reward -- the robot has to figure out physically stable design schemes and feasible actions to manipulate and transport blocks. Due to diverse block sizes, the state space and action trajectories are vast to explore. In this paper, we propose a hierarchical approach for this problem. It consists of a reinforcement-learning designer to propose high-level building instructions and a motion-planning-based action generator to manipulate blocks at the low level. For high-level learning, we develop a novel technique, prioritized memory resetting (PMR) to improve exploration. PMR adaptively resets the state to those most critical configurations from a replay buffer so that the robot can resume training on partial architectures instead of from scratch. Furthermore, we augment PMR with auxiliary training objectives and fine-tune the designer with the locomotion generator. Our experiments in simulation and on a real deployed robotic system demonstrate that it is able to effectively construct bridges with blocks of varying sizes at a high success rate. Demos can be found at https://sites.google.com/view/bridge-pmr.
Abstract（参考訳）: ロボットは、ブループリントなしで、さまざまなサイズのブロックから橋の設計と構築を自律的に学べるだろうか? ロボットは、ブロックを操作して輸送するために、物理的に安定した設計スキームと実行可能なアクションを見つけなければならない。ブロックサイズが多様であるため、状態空間と行動軌道は探索に広く用いられる。本稿では,この問題に対する階層的アプローチを提案する。高いレベルの建築指示を提案する強化学習デザイナと、低レベルのブロックを操作するモーションプランニングベースのアクションジェネレータで構成されている。高レベルの学習のために,探索を改善するためにメモリリセット(PMR)を優先する新しい手法を開発した。 pmrは状態をリプレイバッファから最も重要な設定に適応的にリセットするので、ロボットはスクラッチではなく部分的なアーキテクチャのトレーニングを再開できる。さらに,補助訓練目標でpmrを補強し,ロコモーション発生器で設計者を微調整する。シミュレーションと実際のロボットシステムによる実験により,異なる大きさのブロックを有する橋を,高い成功率で効果的に構築できることを実証した。デモはhttps://sites.google.com/view/bridge-pmrで見ることができる。

関連論文リスト

REMAC: Self-Reflective and Self-Evolving Multi-Agent Collaboration for Long-Horizon Robot Manipulation [57.628771707989166]
本稿では,ReMACと呼ばれる適応型マルチエージェント計画フレームワークを提案する。 ReMACには2つの重要なモジュールが組み込まれており、ループ内で事前条件と後条件チェックを実行し、進捗と計画の洗練を評価する。
論文参考訳（メタデータ） (2025-03-28T03:51:40Z)
FLEX: A Framework for Learning Robot-Agnostic Force-based Skills Involving Sustained Contact Object Manipulation [9.292150395779332]
本稿では,力空間におけるオブジェクト中心の操作ポリシーを学習するための新しいフレームワークを提案する。提案手法は, 動作空間を単純化し, 不要な探索を低減し, シミュレーションオーバーヘッドを低減させる。評価の結果,本手法はベースラインを著しく上回ることがわかった。
論文参考訳（メタデータ） (2025-03-17T17:49:47Z)
The Ingredients for Robotic Diffusion Transformers [47.61690903645525]
我々は,高容量拡散変圧器政策の鍵となる設計決定を同定し,研究し,改善する。結果として得られるモデルは、複数のロボットエンボディメント上の多様なタスクを効率的に解決することができる。当社のポリシーは,高度にマルチモーダルな言語アノテートされたALOHA実証データを用いた10時間トレーニングによるスケーリング性能の向上を示す。
論文参考訳（メタデータ） (2024-10-14T02:02:54Z)
RoboMorph: Evolving Robot Morphology using Large Language Models [0.5812095716568273]
本稿では,モジュール型ロボットの設計を自動生成・最適化するRoboMorphを紹介する。自動プロンプト設計と強化学習に基づく制御アルゴリズムを統合することで、RoboMorphはフィードバックループを通じてロボット設計を反復的に改善する。
論文参考訳（メタデータ） (2024-07-11T16:05:56Z)
RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文参考訳（メタデータ） (2024-02-22T15:12:00Z)
Tiny Reinforcement Learning for Quadruped Locomotion using Decision Transformers [0.9217021281095907]
リソース制約のあるロボットプラットフォームは、低コストのハードウェア代替品を必要とするタスクに役立ちます。本稿では,資源制約のあるロボットプラットフォーム上での模倣学習を実現する手法を提案する。本手法は資源制約された四足歩行ロボットであるBittleの自然視運動を実現する。
論文参考訳（メタデータ） (2024-02-20T18:10:39Z)
RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文参考訳（メタデータ） (2023-11-02T17:59:21Z)
Not Only Rewards But Also Constraints: Applications on Legged Robot Locomotion [2.7052274816160966]
本稿では,報酬と制約の両方からなる複雑なロボットシステムのためのニューラルネットワークコントローラをトレーニングするための,新しい強化学習フレームワークを提案する。学習フレームワークは、異なる形態と物理的特性を持つ複数の脚を持つロボットのトレーニングコントローラに適用され、困難な地形を横断する。
論文参考訳（メタデータ） (2023-08-24T03:06:20Z)
Robot Learning with Sensorimotor Pre-training [98.7755895548928]
ロボット工学のための自己教師型感覚運動器事前学習手法を提案する。我々のモデルはRTTと呼ばれ、センサモレータトークンのシーケンスで動作するトランスフォーマーである。感覚運動の事前学習は、ゼロからトレーニングを一貫して上回り、優れたスケーリング特性を持ち、さまざまなタスク、環境、ロボット間での移動を可能にしている。
論文参考訳（メタデータ） (2023-06-16T17:58:10Z)
Learning to Design and Construct Bridge without Blueprint [20.524052738716435]
ブループリントを使わずに橋を設計・構築する,新しい難易度組立作業について検討する。この作業では,まず任意に広い崖の橋梁構造を設計し,そのブロックを確実に操作し,提案した設計に従って安定な橋梁を構築する必要がある。高レベルでは、深層強化学習とカリキュラム学習を用いて、物理シミュレータでブリッジブループリントポリシーを学習する。低レベル制御のために、実世界の橋梁構築のための訓練された青写真ポリシーと直接結合できる実ロボットモーション制御のためのモーションプランニングベースのポリシーを実装した。
論文参考訳（メタデータ） (2021-08-05T08:17:22Z)
Deep Imitation Learning for Bimanual Robotic Manipulation [70.56142804957187]
本稿では,ロボットによるバイマニュアル操作のための深層模倣学習フレームワークを提案する。中心となる課題は、操作スキルを異なる場所にあるオブジェクトに一般化することである。 i)マルチモーダルダイナミクスを要素運動プリミティブに分解し、(ii)リカレントグラフニューラルネットワークを用いて各プリミティブをパラメータ化して相互作用を捕捉し、(iii)プリミティブを逐次的に構成する高レベルプランナと、プリミティブダイナミクスと逆運動学制御を組み合わせた低レベルコントローラを統合することを提案する。
論文参考訳（メタデータ） (2020-10-11T01:40:03Z)
ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。 ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文参考訳（メタデータ） (2020-08-18T08:05:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。