Fugu-MT 論文翻訳(概要): Safe-Planner: A Single-Outcome Replanner for Computing Strong Cyclic Policies in Fully Observable Non-Deterministic Domains

論文の概要: Safe-Planner: A Single-Outcome Replanner for Computing Strong Cyclic Policies in Fully Observable Non-Deterministic Domains

arxiv url: http://arxiv.org/abs/2109.11471v1
Date: Thu, 23 Sep 2021 16:20:35 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-24 14:54:21.198771
Title: Safe-Planner: A Single-Outcome Replanner for Computing Strong Cyclic Policies in Fully Observable Non-Deterministic Domains
Title（参考訳）: Safe-Planner: 完全に観測可能な非決定論的ドメインにおける強サイクルポリシの計算のための単一アウトカムリプランナ
Authors: Vahid Mokhtari, Ajay Suresha Sathya, Nikolaos Tsiogkas, Wilm Decre
Abstract要約: 我々は、古典的ドメインの集合に非決定論的ドメインをコンパイルするために、単一出力決定に依存する、Safe-Plannerと呼ばれるオフラインのリプランナーを導入する。実験により,この手法により,SPは誤った計画の生成を回避できるが,強い解に直結する弱い計画を生成することができることを示した。
参考スコア（独自算出の注目度）: 0.22940141855172028
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Replanners are efficient methods for solving non-deterministic planning problems. Despite showing good scalability, existing replanners often fail to solve problems involving a large number of misleading plans, i.e., weak plans that do not lead to strong solutions, however, due to their minimal lengths, are likely to be found at every replanning iteration. The poor performance of replanners in such problems is due to their all-outcome determinization. That is, when compiling from non-deterministic to classical, they include all compiled classical operators in a single deterministic domain which leads replanners to continually generate misleading plans. We introduce an offline replanner, called Safe-Planner (SP), that relies on a single-outcome determinization to compile a non-deterministic domain to a set of classical domains, and ordering heuristics for ranking the obtained classical domains. The proposed single-outcome determinization and the heuristics allow for alternating between different classical domains. We show experimentally that this approach can allow SP to avoid generating misleading plans but to generate weak plans that directly lead to strong solutions. The experiments show that SP outperforms state-of-the-art non-deterministic solvers by solving a broader range of problems. We also validate the practical utility of SP in real-world non-deterministic robotic tasks.
Abstract（参考訳）: リプランナーは非決定論的計画問題を解決する効率的な方法である。優れたスケーラビリティを示すにもかかわらず、既存の計画立案者は、多くの誤解を招く計画、すなわち強い解決に繋がらない弱い計画に関わる問題を解決できないことが多い。このような問題におけるリプランナのパフォーマンスの低さは、その全アウトカム決定が原因である。つまり、非決定論的から古典的へコンパイルするとき、それらはすべてのコンパイルされた古典的演算子を単一の決定論的ドメインに含める。本研究では,非決定性ドメインを古典的ドメインの集合にコンパイルする単元決定化と,得られた古典的ドメインのランク付けのためのヒューリスティックスを順序付けする,オフライン再計画器であるsafe-planner (sp)を導入する。提案する単元決定とヒューリスティックは、異なる古典的領域間の交代を可能にする。提案手法により,提案手法は誤った計画の生成を回避できるが,強解に直接導く弱い計画を生成することができることを示す。実験の結果,SPはより広い範囲の問題を解くことにより,最先端の非決定論的解法よりも優れていた。また,実世界の非決定論的ロボット作業におけるSPの実用性を検証する。

関連論文リスト

Satisficing and Optimal Generalised Planning via Goal Regression (Extended Version) [16.43772461453855]
汎用計画 (GP) とは、関連する計画問題のファミリーを解くプログラムを合成するタスクである。 GPのための新しい単純な手法を導入し、各問題に対する一連のトレーニング問題を与えられた場合、ある順序で各ゴール原子に対して最適な計画を計算する。我々は,我々の方法が保証されている条件を定式化し,有効な一般化計画と探索のための状態空間決定公理を学習する。
論文参考訳（メタデータ） (2025-11-14T09:16:32Z)
Seemingly Simple Planning Problems are Computationally Challenging: The Countdown Game [26.665033202052257]
本稿では,Countdownと呼ばれるゲームを中心とした計画ベンチマークを作成する手順を提案する。本稿では,この課題が,計画能力評価のための理想的なベンチマークと関連するデシラタの多くにどのように適合するかを論じる。その結果、24 Game(Countdownの特殊な場合)のような他の領域とは異なり、提案した動的ベンチマークは既存のLCMベースのアプローチでは極めて困難であることが判明した。
論文参考訳（メタデータ） (2025-08-04T21:01:03Z)
Classical Planning with LLM-Generated Heuristics: Challenging the State of the Art with Python Code [8.971234046933349]
大規模言語モデル(LLM)は、計画タスクの詳細な定義を伴っても、確実に計画に失敗する。サイズが大きくなるような配布外タスクであっても、LCMを使って正確な計画を生成する方法を示す。
論文参考訳（メタデータ） (2025-03-24T15:50:20Z)
On Sequential Fault-Intolerant Process Planning [60.66853798340345]
我々は、逐次的フォールトトレラントプロセス計画(SFIPP)と呼ばれる計画問題を提案し、研究する。 SFIPPは、全ての段階が成功する場合にのみ計画が成功すると判断される多くの連続した多段階決定問題に共通する報酬構造をキャプチャする。私たちは、異なるアクションを選択して、それぞれのステージで成功の確率を未知にする必要がある設定のために、確実に厳密なオンラインアルゴリズムを設計します。
論文参考訳（メタデータ） (2025-02-07T15:20:35Z)
LLM-Generated Heuristics for AI Planning: Do We Even Need Domain-Independence Anymore? [87.71321254733384]
大規模言語モデル(LLM)は、特定の計画問題に適した計画手法を生成することができる。 LLMは、いくつかの標準IPCドメインで最先端のパフォーマンスを達成することができる。これらの結果がパラダイムシフトを意味するのか、既存の計画手法をどのように補完するかについて議論する。
論文参考訳（メタデータ） (2025-01-30T22:21:12Z)
Parallel Strategies for Best-First Generalized Planning [51.713634067802104]
汎用計画(GP)は、複数の古典的な計画インスタンスを解くことができるアルゴリズムのようなソリューションの自動合成を研究するAIの研究分野である。現在の進歩の1つはBest-First Generalized Planning (BFGP) の導入である。本稿では,並列探索手法をBFGPに適用し,性能ギャップを埋める上で重要な要素であることを示す。
論文参考訳（メタデータ） (2024-07-31T09:50:22Z)
Learning Logic Specifications for Policy Guidance in POMDPs: an Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。 ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文参考訳（メタデータ） (2024-02-29T15:36:01Z)
LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文参考訳（メタデータ） (2023-12-30T02:53:45Z)
Online POMDP Planning with Anytime Deterministic Guarantees [11.157761902108692]
不確実性の下での計画は、部分的に観測可能なマルコフ決定プロセス(POMDP)を用いて数学的に定式化できる POMDPの最適計画を見つけるには計算コストがかかり、小さなタスクにのみ適用可能である。簡便な解と理論的に最適な解との決定論的関係を導出する。
論文参考訳（メタデータ） (2023-10-03T04:40:38Z)
Lifted Sequential Planning with Lazy Constraint Generation Solvers [28.405198103927955]
本稿では,Lzy Clause Generation(LCG)に基づく制約プログラミング(CP)へのアプローチを用いて,オープンな可能性について検討する。本稿では,いわゆるリフト型因果エンコーディングに基づく新しいCPモデルを提案する。提案手法は,計画手順の少ない計画インスタンスに対して,最適な逐次計画における最先端の手法と非常によく比較可能であることを報告する。
論文参考訳（メタデータ） (2023-07-17T04:54:58Z)
Temporal Planning with Incomplete Knowledge and Perceptual Information [0.0]
本稿では,時間的計画枠組み内での緊急計画構築を組み合わせた新しい計画手法を提案する。本研究では,不完全かつ(ii)知識認識行動をモデル化するために,計画ドメイン定義言語(PDDL)の小さな拡張を提案する。また,様々な問題に対して優れた性能を示す新しい計画領域も導入した。
論文参考訳（メタデータ） (2022-07-20T07:26:08Z)
Differentiable Spatial Planning using Transformers [87.90709874369192]
本研究では、長距離空間依存を計画して行動を生成する障害マップを与えられた空間計画変換器(SPT)を提案する。エージェントが地上の真理マップを知らない環境では、エンド・ツー・エンドのフレームワークで事前訓練されたSPTを利用する。 SPTは、操作タスクとナビゲーションタスクの両方のすべてのセットアップにおいて、最先端の差別化可能なプランナーよりも優れています。
論文参考訳（メタデータ） (2021-12-02T06:48:16Z)
Safe Learning of Lifted Action Models [46.65973550325976]
本稿では,古典計画におけるモデルフリー計画問題の解法を提案する。将来の問題を高い確率で解くのに必要な軌道の数は、ドメインモデルの潜在的サイズにおいて線形である。
論文参考訳（メタデータ） (2021-07-09T01:24:01Z)
Adaptive Belief Discretization for POMDP Planning [7.508023795800546]
多くのPOMDPソルバは、信念空間を均一に識別し、(一般に不明な)カバー数の観点から計画誤差を与える。適応的信念の識別方式を提案し,それに関連する計画誤差を与える。私達は私達のアルゴリズムがさまざまなシナリオの最先端の技術と競争が高いことを証明します。
論文参考訳（メタデータ） (2021-04-15T07:04:32Z)
Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文参考訳（メタデータ） (2020-04-23T18:08:58Z)
STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-01-30T17:08:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。