論文の概要: PRP Rebooted: Advancing the State of the Art in FOND Planning
- arxiv url: http://arxiv.org/abs/2312.11675v2
- Date: Wed, 20 Dec 2023 03:55:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 12:40:06.864752
- Title: PRP Rebooted: Advancing the State of the Art in FOND Planning
- Title(参考訳): PRP再起動:FOND計画における最先端技術
- Authors: Christian Muise, Sheila A. McIlraith, J. Christopher Beck
- Abstract要約: FONDプランニングは、ロボット計画から対話エージェント設計、リアクティブ合成に至るまで、一般的な計画パラダイムである。
本研究では,これまで最も強力なFONDプランナーの足跡を踏襲して,新たな最先端技術を確立する。
我々のプランナーであるPR2は、総合的なベンチマークスイートを表す18のドメインのうち17の領域において、4つの主要なFONDプランナーより決定的に優れています。
- 参考スコア(独自算出の注目度): 20.36372743108606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fully Observable Non-Deterministic (FOND) planning is a variant of classical
symbolic planning in which actions are nondeterministic, with an action's
outcome known only upon execution. It is a popular planning paradigm with
applications ranging from robot planning to dialogue-agent design and reactive
synthesis. Over the last 20 years, a number of approaches to FOND planning have
emerged. In this work, we establish a new state of the art, following in the
footsteps of some of the most powerful FOND planners to date. Our planner, PR2,
decisively outperforms the four leading FOND planners, at times by a large
margin, in 17 of 18 domains that represent a comprehensive benchmark suite.
Ablation studies demonstrate the impact of various techniques we introduce,
with the largest improvement coming from our novel FOND-aware heuristic.
- Abstract(参考訳): 完全な可観測的非決定論的計画(英: Fully Observable Non-Deterministic Planing、FOND)は、行動が非決定論的である古典的象徴的計画の変種である。
ロボット計画から対話エージェント設計、リアクティブ合成まで、様々な応用で人気のある計画パラダイムである。
過去20年間で、FOND計画への多くのアプローチが出現した。
本研究では,これまで最も強力なFONDプランナーの足跡を踏襲して,新たな最先端技術を確立する。
我々のプランナーであるPR2は、総合的なベンチマークスイートを表す18のドメインのうち17の領域において、4つの主要なFONDプランナーより決定的に優れています。
アブレーション研究は,FONDを意識した新しいヒューリスティックから最も大きな改善がもたらされた,導入する様々な技術の影響を実証するものである。
関連論文リスト
- PDDLEGO: Iterative Planning in Textual Environments [56.12148805913657]
テキスト環境における計画は、現在のモデルにおいても長年にわたる課題であることが示されている。
我々は,あるサブゴールの部分的な計画に導く計画表現を反復的に構築するPDDLEGOを提案する。
数ショットのPDDLEGOで作成するプランは,Coin Collectorシミュレーションでエンドツーエンドのプランを生成するよりも43%効率がよいことを示す。
論文 参考訳(メタデータ) (2024-05-30T08:01:20Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - EIPE-text: Evaluation-Guided Iterative Plan Extraction for Long-Form
Narrative Text Generation [114.50719922069261]
長文物語テキスト生成のための評価誘導反復計画抽出法(EIPE-text)を提案する。
EIPEテキストには、計画抽出、学習、推論の3段階がある。
小説やストーリーテリングの分野におけるEIPEテキストの有効性を評価する。
論文 参考訳(メタデータ) (2023-10-12T10:21:37Z) - Probabilistic contingent planning based on HTN for high-quality plans [8.23558342809427]
本稿では,HTNプランナとして High-Quality Contingent Planner (HQCP) を提案する。
HQCPは、部分的に観測可能な環境で高品質な計画を生成する。
HTN計画の形式は部分的な可観測性に拡張され、コストについて評価される。
論文 参考訳(メタデータ) (2023-08-14T03:55:14Z) - AdaPlanner: Adaptive Planning from Feedback with Language Models [56.367020818139665]
大規模言語モデル(LLM)は、最近、シーケンシャルな意思決定タスクの自律的エージェントとして機能する可能性を実証している。
本研究では,LLMエージェントが環境フィードバックに応じて自己生成計画を適応的に改善することのできるクローズドループアプローチであるAdaPlannerを提案する。
幻覚を緩和するために,様々なタスク,環境,エージェント機能にまたがる計画生成を容易にするコードスタイルのLCMプロンプト構造を開発した。
論文 参考訳(メタデータ) (2023-05-26T05:52:27Z) - EmbodiedGPT: Vision-Language Pre-Training via Embodied Chain of Thought [95.37585041654535]
Embodied AIは、ロボットが物理的な環境で長時間のタスクを遂行するためのアクションシーケンスを計画し、実行することができる。
本稿では,EmbodiedGPTを紹介する。EmbodiedGPTは,エンボディドAIのためのエンドツーエンドのマルチモーダル基盤モデルである。
実験は、実施計画、実施制御、視覚的キャプション、視覚的質問応答など、実施されたタスクに対するEmbodiedGPTの有効性を示す。
論文 参考訳(メタデータ) (2023-05-24T11:04:30Z) - Long-Horizon Planning and Execution with Functional Object-Oriented
Networks [79.94575713911189]
タスク計画と実行のためのFOONとしてオブジェクトレベルの知識を活用するというアイデアを紹介します。
提案手法では,FOONをPDDLに自動変換し,市販のプランナ,アクションコンテキスト,ロボットスキルを活用する。
我々はCoppeliaSimの長期タスクに対するアプローチを実証し、学習されたアクションコンテキストを、これまで見たことのないシナリオにどのように拡張できるかを示す。
論文 参考訳(メタデータ) (2022-07-12T19:29:35Z) - Iterative Depth-First Search for Fully Observable Non-Deterministic
Planning [25.2935633334145]
我々は,FOND計画課題を解き,強い循環ポリシーを生成する,新しい反復深度優先探索アルゴリズムを開発した。
提案アルゴリズムはFOND計画のために設計されており,FOND計画の非決定論的側面をより直接的に扱う。
論文 参考訳(メタデータ) (2022-04-08T23:10:30Z) - Flexible FOND Planning with Explicit Fairness Assumptions [16.654542986854896]
完全可観測型非決定論的計画(fond)において命題的目標条件に達する問題を考える。
強周期FOND計画とQNP計画はいずれもFOND計画の特別な事例であり、この形態の公平性を仮定して組み合わせることができる。
論文 参考訳(メタデータ) (2021-03-15T13:57:07Z) - Robust Hierarchical Planning with Policy Delegation [6.1678491628787455]
本稿では,デリゲートの原理に基づく階層計画のための新しいフレームワークとアルゴリズムを提案する。
このプランニング手法は、様々な領域における古典的なプランニングと強化学習技術に対して、実験的に非常に競争力があることを示す。
論文 参考訳(メタデータ) (2020-10-25T04:36:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。