論文の概要: Learning Type-Generalized Actions for Symbolic Planning
- arxiv url: http://arxiv.org/abs/2308.04867v1
- Date: Wed, 9 Aug 2023 11:01:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-10 14:00:18.675451
- Title: Learning Type-Generalized Actions for Symbolic Planning
- Title(参考訳): シンボリックプランニングのための学習型一般化アクション
- Authors: Daniel Tanneberg, Michael Gienger
- Abstract要約: 本稿では,与えられた実体階層を用いてシンボル動作を一般化する新しい概念を提案する。
模擬グリッド型キッチン環境において,少数の観測結果から型一般化動作を学習し,新しい状況に一般化できることが示される。
- 参考スコア(独自算出の注目度): 4.670305538969915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Symbolic planning is a powerful technique to solve complex tasks that require
long sequences of actions and can equip an intelligent agent with complex
behavior. The downside of this approach is the necessity for suitable symbolic
representations describing the state of the environment as well as the actions
that can change it. Traditionally such representations are carefully
hand-designed by experts for distinct problem domains, which limits their
transferability to different problems and environment complexities. In this
paper, we propose a novel concept to generalize symbolic actions using a given
entity hierarchy and observed similar behavior. In a simulated grid-based
kitchen environment, we show that type-generalized actions can be learned from
few observations and generalize to novel situations. Incorporating an
additional on-the-fly generalization mechanism during planning, unseen task
combinations, involving longer sequences, novel entities and unexpected
environment behavior, can be solved.
- Abstract(参考訳): シンボリックプランニングは、アクションの長いシーケンスを必要とする複雑なタスクを解決し、インテリジェントエージェントに複雑な振る舞いを与える強力なテクニックである。
このアプローチの欠点は、環境の状態とそれを変えることができるアクションを記述する適切な象徴表現の必要性である。
伝統的にそのような表現は、異なる問題領域に対する専門家によって慎重に設計され、異なる問題や環境の複雑さへの移動性を制限する。
本稿では,与えられたエンティティ階層を用いてシンボリックアクションを一般化し,類似した振る舞いを観察する新しい概念を提案する。
模擬グリッド型キッチン環境において,少数の観測結果から型一般化行動が学習され,新たな状況に一般化できることを示す。
計画中に追加のオンザフライ一般化機構を導入することで、長いシーケンス、新しいエンティティ、予期せぬ環境行動を含む未確認タスクの組み合わせを解決できる。
関連論文リスト
- AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Optimal task and motion planning and execution for human-robot
multi-agent systems in dynamic environments [54.39292848359306]
本稿では,タスクのシーケンシング,割り当て,実行を最適化するタスクと動作計画の組み合わせを提案する。
このフレームワークはタスクとアクションの分離に依存しており、アクションはシンボル的タスクの幾何学的実現の可能な1つの可能性である。
ロボットアームと人間の作業員がモザイクを組み立てる共同製造シナリオにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-03-27T01:50:45Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Provably Efficient Causal Model-Based Reinforcement Learning for
Systematic Generalization [30.456180468318305]
逐次的意思決定設定では、エージェントは、おそらく無限の、大きな環境の集合に対して体系的な一般化を達成することを目的としている。
本稿では,因果的視点を用いた体系的一般化の抽出可能な定式化について述べる。
特定の構造的仮定の下では、望まざる計画誤差を避けられない準最適項まで保証する単純な学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-14T08:34:51Z) - Anytime Stochastic Task and Motion Policies [12.72186877599064]
本稿では,タスクと動作計画を統合するための新しい手法を提案する。
我々のアルゴリズムは確率論的に完全であり、いつでも実現可能な解ポリシーを計算できる。
論文 参考訳(メタデータ) (2021-08-28T00:23:39Z) - Task and Situation Structures for Service Agent Planning [13.316408384365308]
本稿では,タスクを表現する汎用構造と,状況を表現するための構造を紹介する。
新たに導入された2つの構造に基づいて,ドメインルールのハードコーディングを回避する状況処理手法を提案する。
論文 参考訳(メタデータ) (2021-07-27T14:33:49Z) - CausalCity: Complex Simulations with Agency for Causal Discovery and
Reasoning [68.74447489372037]
本稿では,因果探索と反事実推論のためのアルゴリズムの開発を目的とした,高忠実度シミュレーション環境を提案する。
私たちの作業の中核となるコンポーネントは、複雑なシナリオを定義して作成することが簡単になるような、テキストの緊急性を導入することです。
我々は3つの最先端の手法による実験を行い、ベースラインを作成し、この環境の可利用性を強調する。
論文 参考訳(メタデータ) (2021-06-25T00:21:41Z) - Generalized Inverse Planning: Learning Lifted non-Markovian Utility for
Generalizable Task Representation [83.55414555337154]
本研究では,人間の実演からこのような有用性を学ぶことを研究する。
本稿では,本領域におけるユーティリティ学習のための新しい探索手法である一般化逆計画を提案する。
計算フレームワークである最大エントロピー逆計画(MEIP)について概説し、非マルコフ的効用と関連する概念を生成的に学習する。
論文 参考訳(メタデータ) (2020-11-12T21:06:26Z) - Efficient State Abstraction using Object-centered Predicates for
Manipulation Planning [86.24148040040885]
本稿では,より広い構成空間の変化を特徴付けるオブジェクト中心表現を提案する。
この表現に基づいて、幾何学的および力的整合性を持つ計画の生成を可能にする行動の選択と配置のための普遍的な計画演算子を定義する。
論文 参考訳(メタデータ) (2020-07-16T10:52:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。