論文の概要: Robust Hierarchical Planning with Policy Delegation
- arxiv url: http://arxiv.org/abs/2010.13033v1
- Date: Sun, 25 Oct 2020 04:36:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 04:39:09.317452
- Title: Robust Hierarchical Planning with Policy Delegation
- Title(参考訳): 政策委譲によるロバストな階層計画
- Authors: Tin Lai, Philippe Morere
- Abstract要約: 本稿では,デリゲートの原理に基づく階層計画のための新しいフレームワークとアルゴリズムを提案する。
このプランニング手法は、様々な領域における古典的なプランニングと強化学習技術に対して、実験的に非常に競争力があることを示す。
- 参考スコア(独自算出の注目度): 6.1678491628787455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel framework and algorithm for hierarchical planning based on
the principle of delegation. This framework, the Markov Intent Process,
features a collection of skills which are each specialised to perform a single
task well. Skills are aware of their intended effects and are able to analyse
planning goals to delegate planning to the best-suited skill. This principle
dynamically creates a hierarchy of plans, in which each skill plans for
sub-goals for which it is specialised. The proposed planning method features
on-demand execution---skill policies are only evaluated when needed. Plans are
only generated at the highest level, then expanded and optimised when the
latest state information is available. The high-level plan retains the initial
planning intent and previously computed skills, effectively reducing the
computation needed to adapt to environmental changes. We show this planning
approach is experimentally very competitive to classic planning and
reinforcement learning techniques on a variety of domains, both in terms of
solution length and planning time.
- Abstract(参考訳): 本稿では,デリゲーションの原理に基づく階層計画のための新しい枠組みとアルゴリズムを提案する。
このフレームワークであるMarkov Intent Processは、それぞれがひとつのタスクをうまく実行するように設計されたスキルの集合を特徴としている。
スキルは意図した効果を認識し、計画目標を分析して、最も適したスキルに計画を委譲する。
この原則は動的に計画の階層を形成し、各スキルが特殊化されたサブゴールの計画を作成する。
提案手法はオンデマンド実行を特徴とする-スキルポリシーは必要なときにのみ評価される。
計画は最高レベルでのみ生成され、最新の状態情報が利用可能になったときに拡張および最適化される。
ハイレベルな計画は、初期計画の意図と以前に計算されたスキルを保持し、環境の変化に対応するのに必要な計算を効果的に削減する。
このプランニング手法は,様々な領域における古典的プランニングと強化学習技術と,ソリューションの長さと計画時間の両方において,実験的に非常に競合することを示す。
関連論文リスト
- Propose, Assess, Search: Harnessing LLMs for Goal-Oriented Planning in Instructional Videos [48.15438373870542]
VidAssistは、インストラクショナルビデオにおけるゼロ/フェーショット目標指向の計画のために設計された統合フレームワークである。
最適な計画生成のための幅優先探索アルゴリズムを採用している。
実験によると、VidAssistは異なる目標指向の計画設定のための統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-09-30T17:57:28Z) - LASP: Surveying the State-of-the-Art in Large Language Model-Assisted AI Planning [7.36760703426119]
この調査は、言語モデルで計画する際の既存の課題を強調することを目的としている。
実施環境、最適なスケジューリング、競争と協力のゲーム、タスクの分解、推論、計画といった重要な分野に焦点を当てている。
論文 参考訳(メタデータ) (2024-09-03T11:39:52Z) - Learning adaptive planning representations with natural language
guidance [90.24449752926866]
本稿では,タスク固有の計画表現を自動構築するフレームワークであるAdaについて述べる。
Adaは、プランナー互換の高レベルアクション抽象化と、特定の計画タスク領域に適応した低レベルコントローラのライブラリを対話的に学習する。
論文 参考訳(メタデータ) (2023-12-13T23:35:31Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - A Planning Ontology to Represent and Exploit Planning Knowledge for Performance Efficiency [6.87593454486392]
我々は,エージェントを世界の初期状態から望ましい目標状態へ移動させる一連の行動を見つけることを目的として,自動計画の問題を考える。
利用可能なプランナと多様なプランナドメインが多数用意されていると仮定し、適切なプランナを特定し、ドメインのパフォーマンスを向上させるために活用できる不可欠な情報を持っている。
論文 参考訳(メタデータ) (2023-07-25T14:51:07Z) - Imitating Graph-Based Planning with Goal-Conditioned Policies [72.61631088613048]
本稿では,目標目標条件ポリシにサブゴール条件ポリシを蒸留する自己シミュレーション方式を提案する。
提案手法は,既存の目標条件付きRL手法のサンプル効率を大幅に向上させることができることを実証的に示す。
論文 参考訳(メタデータ) (2023-03-20T14:51:10Z) - A Framework for Neurosymbolic Robot Action Planning using Large Language Models [3.0501524254444767]
本稿では,象徴的タスク計画と機械学習アプローチのギャップを埋めることを目的としたフレームワークを提案する。
大規模言語モデル(LLM)を計画ドメイン定義言語(PDDL)と互換性のあるニューロシンボリックタスクプランナーに訓練する根拠
選択されたドメインにおける予備的な結果から, (i) テストデータセットの95.5%の問題を1,000個のサンプルで解決し, (ii) 従来のシンボルプランナーよりも最大13.5%短いプランを作成し, (iii) 計画の可利用性の平均待ち時間を61.4%まで削減する。
論文 参考訳(メタデータ) (2023-03-01T11:54:22Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。