論文の概要: GHOST: Hierarchical Sub-Goal Policies for Generalizing Robot Manipulation
- arxiv url: http://arxiv.org/abs/2606.10025v1
- Date: Mon, 08 Jun 2026 18:08:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.118507
- Title: GHOST: Hierarchical Sub-Goal Policies for Generalizing Robot Manipulation
- Title(参考訳): GHOST:ロボット操作の一般化のための階層的なサブゴールポリシー
- Authors: Sriram Krishna, Ben Eisner, Haotian Zhan, Ying Yuan, Haoyu Zhen, Chuang Gan, Shubham Tulsiani, David Held,
- Abstract要約: 本稿では,トレーニング分布を超えて一般化したビジュモータ操作ポリシーを学習するための枠組みを提案する。
GHOSTは、(i)多視点RGB-D観測から、3Dエンドエフェクタ上の分布として次のサブゴールを予測する高レベルポリシーに制御を分解する。
一連のタスクの中で、この階層的な分解は、フラットな拡散ポリシーと比較して、パフォーマンスと堅牢性を一貫して改善します。
- 参考スコア(独自算出の注目度): 54.305781492241785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present GHOST, a framework for learning visuomotor manipulation policies that generalize beyond the training distribution. GHOST factorizes control into (i) a high-level policy that predicts the next sub-goal as a distribution over 3D end-effector poses from multi-view RGB-D observations, and (ii) a low-level goal-conditioned controller that executes embodiment-specific actions. To condition image-based policies on 3D goals, we introduce a simple spatial interface that projects predicted goals into the image plane and represents them as end-effector heatmaps. Across a suite of manipulation tasks, this hierarchical factorization consistently improves performance and robustness compared to a flat Diffusion Policy. Further, we show that this hierarchical interface also makes it easy to incorporate human demonstrations without relying on (noisy) action retargeting. As sub-goals are largely embodiment-agnostic, we train the high-level policy on human video to specify how learned skills should be applied and composed, while keeping the low-level policy trained purely on robot data. This hierarchy enables adaptation to novel objects and task variations using a small number of human demonstrations.
- Abstract(参考訳): GHOSTは、トレーニング分布を超えて一般化する、ビジュモータ操作ポリシーを学習するためのフレームワークである。
GHOSTは制御を分解する
一 マルチビューRGB-D観測から、3次元エンドエフェクター上の分布として次のサブゴールを予測する高レベル政策
(II)エンボディメント固有の動作を実行する低レベル目標条件制御器。
画像ベースポリシーを3次元目標に設定するために,画像面に予測目標を投影し,それをエンドエフェクタ・ヒートマップとして表現する,シンプルな空間インタフェースを導入する。
一連の操作タスクの中で、この階層的な分解は、フラットな拡散ポリシーと比較して、パフォーマンスと堅牢性を一貫して改善します。
さらに,この階層的インタフェースにより,(騒々しい)行動再ターゲティングに頼ることなく,人間の実演を組み込むことが容易になることを示す。
サブゴールはほぼ具体的ではないため、ロボットデータに基づいて訓練された低レベルポリシーを維持しながら、人間のビデオに高いレベルのポリシーを訓練し、学習スキルをどのように適用し、構成するかを規定する。
この階層は、少数の人間のデモンストレーションを使用して、新しいオブジェクトやタスクのバリエーションへの適応を可能にする。
関連論文リスト
- SADP: Subgoal-Aware Diffusion Policy for Explainable Robots Learned from Foundation Model Generated Demonstrations [0.0]
サブゴール・アウェア拡散政策(SADP)は、人間の解釈可能なサブゴールを囲む政策実行を構成する。
軽量補助ヘッドは、サブゴール完了状態を予測し、ロボットが現在の実行段階を公開する。
UR5eロボットを用いたRLBenchシミュレーションと実世界の評価実験により,SADPがより高いタスク成功率を達成することを示した。
論文 参考訳(メタデータ) (2026-05-16T08:18:47Z) - Lifting Embodied World Models for Planning and Control [59.09016913513998]
我々は、ハイレベルなアクションを低レベルなジョイントアクションのシーケンスにマッピングする軽量なポリシーを訓練する。
我々は、この枠組みを人間的な実施のためにインスタンス化し、ハイレベルなアクション空間を2次元のウェイポイントの小さなセットとして定義する。
昇降した世界モデルは,低レベルな関節空間で直接探索するよりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2026-04-28T23:59:19Z) - Scaling World Model for Hierarchical Manipulation Policies [61.736772957803026]
Vision-Language-Action(VLA)モデルは、汎用的なロボット操作を約束するが、配布外設定では脆弱である。
本稿では,大規模事前学習型世界モデルの一般化を活用した階層型ビジョン・ランゲージ・アクション・フレームワークを提案する。
視覚目標合成と階層型VLAポリシの両方を,大規模なアウト・オブ・ディストリビューションシナリオで検証する。
論文 参考訳(メタデータ) (2026-02-11T16:12:33Z) - GHIL-Glue: Hierarchical Control with Filtered Subgoal Images [68.36060286192262]
Generative Hierarchical Imitation Learning-Glue (GHIL-Glue) は、言語条件のイメージやビデオ予測モデルを低レベルな目標条件のポリシーで結合するインタフェースである。
GHIL-Glueはタスクの進行に繋がらないサブゴールをフィルタリングし、有害な視覚的アーティファクトを持つ生成されたサブゴールに対するゴール条件付きポリシーの堅牢性を改善する。
我々は、GHIL-Glueが生成サブゴールを利用する複数の階層モデルに対して25%改善するシミュレーション環境と実環境の両方において、広範な実験を行った。
論文 参考訳(メタデータ) (2024-10-26T00:32:21Z) - Imagination Policy: Using Generative Point Cloud Models for Learning Manipulation Policies [25.760946763103483]
Imagination Policy(Imagination Policy)は,高精度ピック・アンド・プレイス・タスクを解くための新しいマルチタスク・キー・フレーム・ポリシー・ネットワークである。
アクションを直接学習する代わりに、Imagination Policy は所望の状態を想像するために点雲を生成し、それが厳密なアクション推定を用いてアクションに変換される。
論文 参考訳(メタデータ) (2024-06-17T17:00:41Z) - Feudal Graph Reinforcement Learning [18.069747511100132]
グラフに基づく表現とメッセージパッシングモジュールポリシーは、強化学習(RL)における構成可能な制御問題に対処するための顕著なアプローチである
本稿では,階層的RLとピラミッド型メッセージパッシングアーキテクチャを頼りに,このような課題に対処する新しい手法であるFeudal Graph Reinforcement Learning (FGRL)を提案する。
特に、FGRLは階層化されたグラフ構造を通して、階層の上部から上位のコマンドが伝播するポリシーの階層を定義している。
論文 参考訳(メタデータ) (2023-04-11T09:51:13Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。