論文の概要: Safe-Planner: A Single-Outcome Replanner for Computing Strong Cyclic
Policies in Fully Observable Non-Deterministic Domains
- arxiv url: http://arxiv.org/abs/2109.11471v1
- Date: Thu, 23 Sep 2021 16:20:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-24 14:54:21.198771
- Title: Safe-Planner: A Single-Outcome Replanner for Computing Strong Cyclic
Policies in Fully Observable Non-Deterministic Domains
- Title(参考訳): Safe-Planner: 完全に観測可能な非決定論的ドメインにおける強サイクルポリシの計算のための単一アウトカムリプランナ
- Authors: Vahid Mokhtari, Ajay Suresha Sathya, Nikolaos Tsiogkas, Wilm Decre
- Abstract要約: 我々は、古典的ドメインの集合に非決定論的ドメインをコンパイルするために、単一出力決定に依存する、Safe-Plannerと呼ばれるオフラインのリプランナーを導入する。
実験により,この手法により,SPは誤った計画の生成を回避できるが,強い解に直結する弱い計画を生成することができることを示した。
- 参考スコア(独自算出の注目度): 0.22940141855172028
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Replanners are efficient methods for solving non-deterministic planning
problems. Despite showing good scalability, existing replanners often fail to
solve problems involving a large number of misleading plans, i.e., weak plans
that do not lead to strong solutions, however, due to their minimal lengths,
are likely to be found at every replanning iteration. The poor performance of
replanners in such problems is due to their all-outcome determinization. That
is, when compiling from non-deterministic to classical, they include all
compiled classical operators in a single deterministic domain which leads
replanners to continually generate misleading plans. We introduce an offline
replanner, called Safe-Planner (SP), that relies on a single-outcome
determinization to compile a non-deterministic domain to a set of classical
domains, and ordering heuristics for ranking the obtained classical domains.
The proposed single-outcome determinization and the heuristics allow for
alternating between different classical domains. We show experimentally that
this approach can allow SP to avoid generating misleading plans but to generate
weak plans that directly lead to strong solutions. The experiments show that SP
outperforms state-of-the-art non-deterministic solvers by solving a broader
range of problems. We also validate the practical utility of SP in real-world
non-deterministic robotic tasks.
- Abstract(参考訳): リプランナーは非決定論的計画問題を解決する効率的な方法である。
優れたスケーラビリティを示すにもかかわらず、既存の計画立案者は、多くの誤解を招く計画、すなわち強い解決に繋がらない弱い計画に関わる問題を解決できないことが多い。
このような問題におけるリプランナのパフォーマンスの低さは、その全アウトカム決定が原因である。
つまり、非決定論的から古典的へコンパイルするとき、それらはすべてのコンパイルされた古典的演算子を単一の決定論的ドメインに含める。
本研究では,非決定性ドメインを古典的ドメインの集合にコンパイルする単元決定化と,得られた古典的ドメインのランク付けのためのヒューリスティックスを順序付けする,オフライン再計画器であるsafe-planner (sp)を導入する。
提案する単元決定とヒューリスティックは、異なる古典的領域間の交代を可能にする。
提案手法により,提案手法は誤った計画の生成を回避できるが,強解に直接導く弱い計画を生成することができることを示す。
実験の結果,SPはより広い範囲の問題を解くことにより,最先端の非決定論的解法よりも優れていた。
また,実世界の非決定論的ロボット作業におけるSPの実用性を検証する。
関連論文リスト
- Parallel Strategies for Best-First Generalized Planning [51.713634067802104]
汎用計画(GP)は、複数の古典的な計画インスタンスを解くことができるアルゴリズムのようなソリューションの自動合成を研究するAIの研究分野である。
現在の進歩の1つはBest-First Generalized Planning (BFGP) の導入である。
本稿では,並列探索手法をBFGPに適用し,性能ギャップを埋める上で重要な要素であることを示す。
論文 参考訳(メタデータ) (2024-07-31T09:50:22Z) - Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。
当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文 参考訳(メタデータ) (2023-12-30T02:53:45Z) - Online POMDP Planning with Anytime Deterministic Guarantees [11.157761902108692]
不確実性の下での計画は、部分的に観測可能なマルコフ決定プロセス(POMDP)を用いて数学的に定式化できる
POMDPの最適計画を見つけるには計算コストがかかり、小さなタスクにのみ適用可能である。
簡便な解と理論的に最適な解との決定論的関係を導出する。
論文 参考訳(メタデータ) (2023-10-03T04:40:38Z) - Lifted Sequential Planning with Lazy Constraint Generation Solvers [28.405198103927955]
本稿では,Lzy Clause Generation(LCG)に基づく制約プログラミング(CP)へのアプローチを用いて,オープンな可能性について検討する。
本稿では,いわゆるリフト型因果エンコーディングに基づく新しいCPモデルを提案する。
提案手法は,計画手順の少ない計画インスタンスに対して,最適な逐次計画における最先端の手法と非常によく比較可能であることを報告する。
論文 参考訳(メタデータ) (2023-07-17T04:54:58Z) - Temporal Planning with Incomplete Knowledge and Perceptual Information [0.0]
本稿では,時間的計画枠組み内での緊急計画構築を組み合わせた新しい計画手法を提案する。
本研究では,不完全かつ(ii)知識認識行動をモデル化するために,計画ドメイン定義言語(PDDL)の小さな拡張を提案する。
また,様々な問題に対して優れた性能を示す新しい計画領域も導入した。
論文 参考訳(メタデータ) (2022-07-20T07:26:08Z) - Differentiable Spatial Planning using Transformers [87.90709874369192]
本研究では、長距離空間依存を計画して行動を生成する障害マップを与えられた空間計画変換器(SPT)を提案する。
エージェントが地上の真理マップを知らない環境では、エンド・ツー・エンドのフレームワークで事前訓練されたSPTを利用する。
SPTは、操作タスクとナビゲーションタスクの両方のすべてのセットアップにおいて、最先端の差別化可能なプランナーよりも優れています。
論文 参考訳(メタデータ) (2021-12-02T06:48:16Z) - Safe Learning of Lifted Action Models [46.65973550325976]
本稿では,古典計画におけるモデルフリー計画問題の解法を提案する。
将来の問題を高い確率で解くのに必要な軌道の数は、ドメインモデルの潜在的サイズにおいて線形である。
論文 参考訳(メタデータ) (2021-07-09T01:24:01Z) - Adaptive Belief Discretization for POMDP Planning [7.508023795800546]
多くのPOMDPソルバは、信念空間を均一に識別し、(一般に不明な)カバー数の観点から計画誤差を与える。
適応的信念の識別方式を提案し,それに関連する計画誤差を与える。
私達は私達のアルゴリズムがさまざまなシナリオの最先端の技術と競争が高いことを証明します。
論文 参考訳(メタデータ) (2021-04-15T07:04:32Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z) - STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。
アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-30T17:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。