論文の概要: Inventing Relational State and Action Abstractions for Effective and
Efficient Bilevel Planning
- arxiv url: http://arxiv.org/abs/2203.09634v1
- Date: Thu, 17 Mar 2022 22:13:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 08:09:57.572168
- Title: Inventing Relational State and Action Abstractions for Effective and
Efficient Bilevel Planning
- Title(参考訳): 効果的な2段階計画のための関係状態と行動抽象化の創出
- Authors: Tom Silver, Rohan Chitnis, Nishanth Kumar, Willie McClinton, Tomas
Lozano-Perez, Leslie Pack Kaelbling, Joshua Tenenbaum
- Abstract要約: 我々は状態と行動の抽象化を学習するための新しいフレームワークを開発する。
我々は、対象のアイデンティティや数値を一般化するリレーショナル、ニューロシンボリックな抽象化を学ぶ。
学習した抽象化によって、より長い地平線のホールドアウトタスクを迅速に解決できることが示されています。
- 参考スコア(独自算出の注目度): 26.715198108255162
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective and efficient planning in continuous state and action spaces is
fundamentally hard, even when the transition model is deterministic and known.
One way to alleviate this challenge is to perform bilevel planning with
abstractions, where a high-level search for abstract plans is used to guide
planning in the original transition space. In this paper, we develop a novel
framework for learning state and action abstractions that are explicitly
optimized for both effective (successful) and efficient (fast) bilevel
planning. Given demonstrations of tasks in an environment, our data-efficient
approach learns relational, neuro-symbolic abstractions that generalize over
object identities and numbers. The symbolic components resemble the STRIPS
predicates and operators found in AI planning, and the neural components refine
the abstractions into actions that can be executed in the environment.
Experimentally, we show across four robotic planning environments that our
learned abstractions are able to quickly solve held-out tasks of longer
horizons than were seen in the demonstrations, and can even outperform the
efficiency of abstractions that we manually specified. We also find that as the
planner configuration varies, the learned abstractions adapt accordingly,
indicating that our abstraction learning method is both "task-aware" and
"planner-aware." Code: https://tinyurl.com/predicators-release
- Abstract(参考訳): 連続状態と作用空間における効率的な計画法は、遷移モデルが決定論的で知られている場合でも、基本的に難しい。
この課題を緩和する1つの方法は、抽象的な空間における計画の指針として、抽象的な計画の高レベルな探索が使用される、二段階的な計画を実行することである。
本稿では,実効性(重要度)と効率性(高速性)の両方に明示的に最適化された,状態と行動の抽象化を学習するための新しいフレームワークを開発する。
環境におけるタスクのデモンストレーションを考えると、データ効率のよいアプローチは、オブジェクトのアイデンティティと数値を一般化する、リレーショナルでニューロシンボリックな抽象化を学習します。
シンボリックなコンポーネントは、ai計画に見られるストリップ述語と演算子に似ており、ニューラルネットワークコンポーネントは、環境内で実行できるアクションに抽象化を洗練する。
実験では、4つのロボット計画環境にまたがって、学習した抽象概念がデモで見られたよりも長い地平線の保留タスクを迅速に解き、手作業で指定した抽象化の効率を上回ります。
また、プランナー構成が変化するにつれて、学習した抽象概念が適応し、抽象化学習手法が「タスク認識」と「プランナー認識」の両方であることを示す。
コード: https://tinyurl.com/predicators-release
関連論文リスト
- VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning [86.59849798539312]
本稿では,記号的・神経的知識表現の強みを組み合わせた一階抽象言語Neuro-Symbolic Predicatesを提案する。
提案手法は, サンプルの複雑さの向上, 分布外一般化の強化, 解釈可能性の向上を実現する。
論文 参考訳(メタデータ) (2024-10-30T16:11:05Z) - Embodied Instruction Following in Unknown Environments [66.60163202450954]
未知環境における複雑なタスクに対するEIF(Embodied instruction following)法を提案する。
我々は,ハイレベルなタスクプランナと低レベルな探索コントローラを含む,階層的な具体化命令に従うフレームワークを構築した。
タスクプランナに対しては、タスク完了プロセスと既知の視覚的手がかりに基づいて、人間の目標達成のための実行可能なステップバイステッププランを生成する。
論文 参考訳(メタデータ) (2024-06-17T17:55:40Z) - Learning Planning Abstractions from Language [28.855381137615275]
本稿では,シーケンシャルな意思決定領域における状態と行動の抽象化を学習するためのフレームワークを提案する。
言語からの抽象化(PARL)を計画する我々のフレームワークは、言語アノテーションによる実演を利用して、象徴的で抽象的なアクション空間を自動的に発見する。
論文 参考訳(メタデータ) (2024-05-06T21:24:22Z) - Learning with Language-Guided State Abstractions [58.199148890064826]
高次元観測空間における一般化可能なポリシー学習は、よく設計された状態表現によって促進される。
我々の手法であるLGAは、自然言語の監視と言語モデルからの背景知識を組み合わせて、目に見えないタスクに適した状態表現を自動構築する。
シミュレーションされたロボットタスクの実験では、LGAは人間によって設計されたものと同様の状態抽象化をもたらすが、そのほんの少しの時間で得られる。
論文 参考訳(メタデータ) (2024-02-28T23:57:04Z) - From Reals to Logic and Back: Inventing Symbolic Vocabularies, Actions,
and Models for Planning from Raw Data [20.01856556195228]
本稿では,抽象状態と行動に対する論理に基づく関係表現を自律的に学習する最初の手法を提案する。
学習された表現は自動発明されたPDDLのようなドメインモデルを構成する。
決定論的設定における実証的な結果は、少数のロボット軌道から強力な抽象表現を学ぶことができることを示している。
論文 参考訳(メタデータ) (2024-02-19T06:28:21Z) - Learning adaptive planning representations with natural language
guidance [90.24449752926866]
本稿では,タスク固有の計画表現を自動構築するフレームワークであるAdaについて述べる。
Adaは、プランナー互換の高レベルアクション抽象化と、特定の計画タスク領域に適応した低レベルコントローラのライブラリを対話的に学習する。
論文 参考訳(メタデータ) (2023-12-13T23:35:31Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。
同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。
実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T15:04:39Z) - Learning Efficient Abstract Planning Models that Choose What to Predict [28.013014215441505]
多くのロボティクス分野において,既存の記号演算子学習アプローチが不足していることが示されている。
これは主に、抽象状態におけるすべての観測された変化を正確に予測する演算子を学習しようとするためである。
我々は,特定の目標を達成するための抽象的計画に必要な変化をモデル化するだけで,「予測すべきものを選択する」演算子を学習することを提案する。
論文 参考訳(メタデータ) (2022-08-16T13:12:59Z) - Using Deep Learning to Bootstrap Abstractions for Hierarchical Robot
Planning [27.384742641275228]
階層的な計画プロセス全体をブートストラップするための新しいアプローチを提案する。
これは、新しい環境に対する抽象状態とアクションが自動的に計算される方法を示している。
学習した抽象概念を、新しいマルチソース双方向階層型ロボット計画アルゴリズムに用いている。
論文 参考訳(メタデータ) (2022-02-02T08:11:20Z) - Active Learning of Abstract Plan Feasibility [17.689758291966502]
本稿では,タスクに依存しない,好奇心を抱くロボットの探索を通じて,APF予測器を効率的に取得するための能動的学習手法を提案する。
アクティブラーニング戦略において,本システムでは,本システムでより少ないデータから学習できるように,実用不可能なサブシーケンス特性を活用して,候補計画の立案を行う。
物体が一様でない質量分布を持つ積層領域において,本システムは,400個の自己教師による相互作用において,APFモデルの実際のロボット学習を可能にすることを示す。
論文 参考訳(メタデータ) (2021-07-01T18:17:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。