論文の概要: Learning Operators with Ignore Effects for Bilevel Planning in
Continuous Domains
- arxiv url: http://arxiv.org/abs/2208.07737v1
- Date: Tue, 16 Aug 2022 13:12:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:11:11.298481
- Title: Learning Operators with Ignore Effects for Bilevel Planning in
Continuous Domains
- Title(参考訳): 連続領域における2レベル計画のための無視効果を持つ学習演算子
- Authors: Nishanth Kumar, Willie McClinton, Rohan Chitnis, Tom Silver, Tom\'as
Lozano-P\'erez, Leslie Pack Kaelbling
- Abstract要約: 既存のアプローチは、アクションが多くの述語を変える傾向にある環境では不十分であることを示す。
このアプローチを動機づける主要なアイデアは、述語における観察されたすべての変化をモデル化することは不要である、ということです。
提案手法は,6つのハイブリッドロボット領域にまたがる効果を無視する演算子を学習できることを示す。
- 参考スコア(独自算出の注目度): 28.307846585210385
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bilevel planning, in which a high-level search over an abstraction of an
environment is used to guide low-level decision making, is an effective
approach to solving long-horizon tasks in continuous state and action spaces.
Recent work has shown that action abstractions that enable such bilevel
planning can be learned in the form of symbolic operators and neural samplers
given symbolic predicates and demonstrations that achieve known goals. In this
work, we show that existing approaches fall short in environments where actions
tend to cause a large number of predicates to change. To address this issue, we
propose to learn operators with ignore effects. The key idea motivating our
approach is that modeling every observed change in the predicates is
unnecessary; the only changes that need be modeled are those that are necessary
for high-level search to achieve the specified goal. Experimentally, we show
that our approach is able to learn operators with ignore effects across six
hybrid robotic domains that enable an agent to solve novel variations of a
task, with different initial states, goals, and numbers of objects,
significantly more efficiently than several baselines.
- Abstract(参考訳): 環境の抽象化をハイレベルに探索して低レベルの意思決定を導く二段階計画は、連続状態や行動空間における長期的タスクの解決に有効な手法である。
近年の研究では、そのような二段階計画を可能にする行動抽象化が、既知の目標を達成する象徴的な述語や実証を与えられた記号演算子やニューラルサンプリングの形で学習できることが示されている。
本研究では,行動が多くの述語の変化を引き起こす環境において,既存のアプローチが不足していることを示す。
この問題に対処するために,無視効果を持つ演算子を学習することを提案する。
我々のアプローチを動機づける重要なアイデアは、述語におけるすべての観測された変化をモデル化することは不要であり、モデル化される唯一の変更は、指定された目標を達成するために高レベルの探索を必要とするものである。
実験により,提案手法は6つのハイブリッドロボットドメインにまたがる無視効果を持つオペレーターを学習できることを示し,エージェントが異なる初期状態,目標,対象数の異なるタスクの新たなバリエーションを,複数のベースラインよりも有意に効率的に解くことができることを示した。
関連論文リスト
- VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning [86.59849798539312]
本稿では,記号的・神経的知識表現の強みを組み合わせた一階抽象言語Neuro-Symbolic Predicatesを提案する。
提案手法は, サンプルの複雑さの向上, 分布外一般化の強化, 解釈可能性の向上を実現する。
論文 参考訳(メタデータ) (2024-10-30T16:11:05Z) - Learning Abstract World Model for Value-preserving Planning with Options [11.254212901595523]
所与の時間的拡張行動の構造を利用して抽象マルコフ決定過程(MDP)を学習する。
我々は、これらのスキルによる計画が、抽象MDPにおける軌跡をシミュレートすることによって、元のMDPにおける有界値損失のポリシーをもたらすことを確実にするために必要な状態抽象化を特徴付ける。
目標をベースとしたナビゲーション環境では,連続的な抽象状態の計画が成功し,抽象モデル学習が計画と学習のサンプル効率を向上させることを示す。
論文 参考訳(メタデータ) (2024-06-22T13:41:02Z) - From Reals to Logic and Back: Inventing Symbolic Vocabularies, Actions,
and Models for Planning from Raw Data [20.01856556195228]
本稿では,抽象状態と行動に対する論理に基づく関係表現を自律的に学習する最初の手法を提案する。
学習された表現は自動発明されたPDDLのようなドメインモデルを構成する。
決定論的設定における実証的な結果は、少数のロボット軌道から強力な抽象表現を学ぶことができることを示している。
論文 参考訳(メタデータ) (2024-02-19T06:28:21Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。
同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。
実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T15:04:39Z) - Learning Neuro-Symbolic Skills for Bilevel Planning [63.388694268198655]
意思決定は、連続したオブジェクト中心の状態、継続的なアクション、長い地平線、まばらなフィードバックを持つロボット環境では難しい。
タスク・アンド・モーション・プランニング(TAMP)のような階層的なアプローチは、意思決定を2つ以上の抽象レベルに分解することでこれらの課題に対処する。
我々の主な貢献は、オペレーターとサンプルラーを組み合わせたパラメータ化警察の学習方法である。
論文 参考訳(メタデータ) (2022-06-21T19:01:19Z) - Inventing Relational State and Action Abstractions for Effective and
Efficient Bilevel Planning [26.715198108255162]
我々は状態と行動の抽象化を学習するための新しいフレームワークを開発する。
我々は、対象のアイデンティティや数値を一般化するリレーショナル、ニューロシンボリックな抽象化を学ぶ。
学習した抽象化によって、より長い地平線のホールドアウトタスクを迅速に解決できることが示されています。
論文 参考訳(メタデータ) (2022-03-17T22:13:09Z) - Using Deep Learning to Bootstrap Abstractions for Hierarchical Robot
Planning [27.384742641275228]
階層的な計画プロセス全体をブートストラップするための新しいアプローチを提案する。
これは、新しい環境に対する抽象状態とアクションが自動的に計算される方法を示している。
学習した抽象概念を、新しいマルチソース双方向階層型ロボット計画アルゴリズムに用いている。
論文 参考訳(メタデータ) (2022-02-02T08:11:20Z) - Procedure Planning in Instructional Videosvia Contextual Modeling and
Model-based Policy Learning [114.1830997893756]
本研究は,実生活ビデオにおける目標指向アクションを計画するモデルを学習することに焦点を当てる。
本研究では,ベイズ推論とモデルに基づく模倣学習を通して,人間の行動のモデル化を行う新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-05T01:06:53Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z) - Transferable Task Execution from Pixels through Deep Planning Domain
Learning [46.88867228115775]
階層モデルを学ぶために,DPDL(Deep Planning Domain Learning)を提案する。
DPDLは、現在の象徴的世界状態からなる論理述語セットの値を予測する高レベルモデルを学ぶ。
これにより、ロボットが明示的に訓練されていなくても、複雑なマルチステップタスクを実行できます。
論文 参考訳(メタデータ) (2020-03-08T05:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。