論文の概要: Goal Sets, Not Goal States: Queryable Robot Goals through Goal-Set Hindsight Relabeling
- arxiv url: http://arxiv.org/abs/2606.09476v1
- Date: Mon, 08 Jun 2026 13:35:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:07.093684
- Title: Goal Sets, Not Goal States: Queryable Robot Goals through Goal-Set Hindsight Relabeling
- Title(参考訳): ゴールセット、ゴールではなくゴールセット:ゴールセットのハイビジョンリラベルを通じてクエリ可能なロボットゴール
- Authors: Carlos Vélez García, Miguel Cazorla, Jorge Pomares,
- Abstract要約: Hindsight relabelingは通常、達成した状態を正確な目標に変え、オフラインのロボット学習を過度に制限する。
本稿では,HER の述語レベルの一般化である Goal-Set Hindsight Relabeling (GS-HER) を提案する。
- 参考スコア(独自算出の注目度): 0.8703455323398351
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hindsight relabeling usually turns achieved future states into exact goals, which can overconstrain offline robot learning when task success depends only on a subset of the state. We propose Goal-Set Hindsight Relabeling (GS-HER), a predicate-level generalization of HER in which achieved states certify query-defined goal sets rather than singleton goal states. A binary query specifies which variables define success, making the goal predicate an inference-time input while leaving the underlying offline GCRL algorithm unchanged. Across OGBench tasks and five offline goal-conditioned learners, GS-HER improves performance when full-state goals are bottlenecked by nuisance dimensions and turns hindsight relabeling into a reusable goal interface: one checkpoint can answer multiple robot goal predicates without retraining.
- Abstract(参考訳): Hindsight relabelingは通常、達成した将来の状態を正確な目標に変え、タスクの成功が状態のサブセットにのみ依存する場合、オフラインのロボット学習を過度に制限することができる。
本稿では,HER の述語レベルの一般化である Goal-Set Hindsight Relabeling (GS-HER) を提案する。
バイナリクエリは、どの変数が成功を定義するかを定義し、基礎となるオフラインGCRLアルゴリズムをそのままにして、目標が推論時入力を予測させる。
OGBenchタスクと5つのオフラインの目標条件学習者の間で、GS-HERは、フルステートのゴールがニュアンス次元によってボトルネックとなるときのパフォーマンスを改善し、後見の終端を再利用可能な目標インターフェースに変える。
関連論文リスト
- First-Order Representation Languages for Goal-Conditioned RL [8.89493507314525]
目標条件付きRLと一般化計画における一階述語の使用を検討する。
問題は、トレーニングインスタンスが大きい場合、目標条件付きおよび一般的なポリシーをどのように学習するかだ。
状態と目標が原子の集合で表されるとき、さらなる性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2025-12-22T12:54:32Z) - HIQL: Offline Goal-Conditioned RL with Latent States as Actions [81.67963770528753]
オフラインデータからゴール条件付きRLの階層的アルゴリズムを提案する。
この階層的な分解によって、推定値関数のノイズに頑健になることを示す。
提案手法は,従来の手法を巧みに操り,高次元画像観察にスケールできるとともに,アクションフリーなデータを容易に利用することができる。
論文 参考訳(メタデータ) (2023-07-22T00:17:36Z) - Discrete Factorial Representations as an Abstraction for Goal
Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。
分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文 参考訳(メタデータ) (2022-11-01T03:31:43Z) - Bisimulation Makes Analogies in Goal-Conditioned Reinforcement Learning [71.52722621691365]
リッチな観測から汎用的な目標条件エージェントを構築することは、実世界の問題を解決するための強化学習(RL)の鍵となる。
目的条件ビシミュレーションと呼ばれる新しい状態抽象化法を提案する。
この抽象概念の計量形式を用いてこの表現を学習し、シミュレーション操作タスクにおける新しい目標に一般化する能力を示す。
論文 参考訳(メタデータ) (2022-04-27T17:00:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。