論文の概要: Abstract-to-Executable Trajectory Translation for One-Shot Task
Generalization
- arxiv url: http://arxiv.org/abs/2210.07658v2
- Date: Tue, 30 May 2023 23:44:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 04:09:13.998637
- Title: Abstract-to-Executable Trajectory Translation for One-Shot Task
Generalization
- Title(参考訳): ワンショットタスク一般化のための抽象実行可能軌道変換
- Authors: Stone Tao, Xiaochen Li, Tongzhou Mu, Zhiao Huang, Yuzhe Qin and Hao Su
- Abstract要約: 本稿では,計画生成と計画実行を分離し,ワンショットタスクの一般化を実現することを提案する。
提案手法は,2組の抽象環境を構築し,抽象トラジェクトリを生成し,抽象から実行可能なトラジェクトリトランスレータによって元のタスクを解くという,複雑な長期タスクを3つのステップで解決する。
- 参考スコア(独自算出の注目度): 21.709054087028946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training long-horizon robotic policies in complex physical environments is
essential for many applications, such as robotic manipulation. However,
learning a policy that can generalize to unseen tasks is challenging. In this
work, we propose to achieve one-shot task generalization by decoupling plan
generation and plan execution. Specifically, our method solves complex
long-horizon tasks in three steps: build a paired abstract environment by
simplifying geometry and physics, generate abstract trajectories, and solve the
original task by an abstract-to-executable trajectory translator. In the
abstract environment, complex dynamics such as physical manipulation are
removed, making abstract trajectories easier to generate. However, this
introduces a large domain gap between abstract trajectories and the actual
executed trajectories as abstract trajectories lack low-level details and are
not aligned frame-to-frame with the executed trajectory. In a manner
reminiscent of language translation, our approach leverages a seq-to-seq model
to overcome the large domain gap between the abstract and executable
trajectories, enabling the low-level policy to follow the abstract trajectory.
Experimental results on various unseen long-horizon tasks with different robot
embodiments demonstrate the practicability of our methods to achieve one-shot
task generalization.
- Abstract(参考訳): 複雑な物理的環境での長距離ロボット政策の訓練は、ロボット操作のような多くのアプリケーションにとって不可欠である。
しかし、目に見えないタスクに一般化できるポリシーを学ぶことは難しい。
本研究では,計画生成と計画実行を分離してワンショットタスクの一般化を実現することを提案する。
具体的には、幾何学と物理学を単純化して対の抽象環境を構築し、抽象的軌跡を生成し、抽象から実行可能な軌道変換器によって元のタスクを解決する。
抽象的な環境では、物理的操作のような複雑な力学が取り除かれ、抽象的な軌道が生成しやすくなる。
しかし、抽象トラジェクトリと実際の実行トラジェクトリとの間の大きなドメインギャップは、抽象トラジェクトリは低レベルの詳細を欠いているため、実行トラジェクトリとフレーム間の整合性がないためである。
言語翻訳を思い起こさせる方法で、このアプローチでは、seq-to-seqモデルを利用して、抽象と実行可能な軌道の間の大きなドメイン間ギャップを克服し、低レベルのポリシーが抽象的軌道に従うことができる。
ロボットの実施形態が異なる様々な不明瞭な長軸タスクの実験結果から,ワンショットタスクの一般化を実現するための手法の実践性を示す。
関連論文リスト
- RT-Affordance: Affordances are Versatile Intermediate Representations for Robot Manipulation [52.14638923430338]
本稿では,タスクの重要段階においてロボットのポーズを捉えた割安条件の条件付けについて提案する。
RT-Affordanceという手法は階層モデルであり,まずタスク言語が与えられた割当計画を提案する。
RT-Affordanceが既存手法の性能を50%以上上回る新しいタスク群を示す。
論文 参考訳(メタデータ) (2024-11-05T01:02:51Z) - HACMan++: Spatially-Grounded Motion Primitives for Manipulation [28.411361363637006]
本稿では,HACMan++における空間的パラメータ化動作プリミティブについて紹介する。
環境中の空間的位置にプリミティブを接地することで、オブジェクトの形状を効果的に一般化し、バリエーションを表現できる。
提案手法は既存の手法,特に高レベルシーケンシャル推論とオブジェクト一般化の両方を必要とする複雑なシナリオにおいて,優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-07-11T15:10:14Z) - Unified Task and Motion Planning using Object-centric Abstractions of
Motion Constraints [56.283944756315066]
本稿では,タスクとモーションプランニングを一つの検索に統一するTAMP手法を提案する。
我々のアプローチは、オフザシェルフAIサーチの計算効率を活用して、物理的に実現可能な計画が得られるような、オブジェクト中心の動作制約の抽象化に基づいている。
論文 参考訳(メタデータ) (2023-12-29T14:00:20Z) - RT-Trajectory: Robotic Task Generalization via Hindsight Trajectory
Sketches [74.300116260004]
一般化は、ロバストなロボット学習システムにとって最も重要なデシダータの1つである。
粗い軌道スケッチを用いたポリシー条件付け手法を提案する。
RT-Trajectoryは言語条件や目標条件よりも幅広いタスクを実行できることを示す。
論文 参考訳(メタデータ) (2023-11-03T15:31:51Z) - Planning Immediate Landmarks of Targets for Model-Free Skill Transfer
across Agents [34.56191646231944]
我々はPILoT、即時ターゲットのランドマーク計画を提案する。
PILoTはゴール条件のステートプランナーを学習し、ゴールプランナーを蒸留してモデルなしのスタイルで即時ランドマークを計画する。
PILoTは,アクション空間やダイナミックスを横断する数発のショット転送など,様々なトランスファーの課題に対して有効であることを示す。
論文 参考訳(メタデータ) (2022-12-18T08:03:21Z) - Inventing Relational State and Action Abstractions for Effective and
Efficient Bilevel Planning [26.715198108255162]
我々は状態と行動の抽象化を学習するための新しいフレームワークを開発する。
我々は、対象のアイデンティティや数値を一般化するリレーショナル、ニューロシンボリックな抽象化を学ぶ。
学習した抽象化によって、より長い地平線のホールドアウトタスクを迅速に解決できることが示されています。
論文 参考訳(メタデータ) (2022-03-17T22:13:09Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - Learning Abstract Models for Strategic Exploration and Fast Reward
Transfer [85.19766065886422]
我々は,抽象状態のマルコフ決定過程(MDP)を正確に学習し,複雑なエラーを避ける。
本手法は,最も難易度の高い3つのアーケード学習環境ゲームにおいて,強力な結果をもたらす。
学習した抽象MDPを新しい報酬関数に再利用することができ、スクラッチから訓練されたモデルフリーメソッドよりも1000倍少ないサンプルで高い報酬が得られる。
論文 参考訳(メタデータ) (2020-07-12T03:33:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。