論文の概要: Iterative Depth-First Search for Fully Observable Non-Deterministic
Planning
- arxiv url: http://arxiv.org/abs/2204.04322v1
- Date: Fri, 8 Apr 2022 23:10:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 15:43:36.550469
- Title: Iterative Depth-First Search for Fully Observable Non-Deterministic
Planning
- Title(参考訳): 完全観測可能な非決定論的計画のための反復的深さ優先探索
- Authors: Ramon Fraga Pereira, Andr\'e G. Pereira, Frederico Messa, and Giuseppe
De Giacomo
- Abstract要約: 我々は,FOND計画課題を解き,強い循環ポリシーを生成する,新しい反復深度優先探索アルゴリズムを開発した。
提案アルゴリズムはFOND計画のために設計されており,FOND計画の非決定論的側面をより直接的に扱う。
- 参考スコア(独自算出の注目度): 25.2935633334145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fully Observable Non-Deterministic (FOND) planning models uncertainty through
actions with non-deterministic effects. Existing FOND planning algorithms are
effective and employ a wide range of techniques. However, most of the existing
algorithms are not robust for dealing with both non-determinism and task size.
In this paper, we develop a novel iterative depth-first search algorithm that
solves FOND planning tasks and produces strong cyclic policies. Our algorithm
is explicitly designed for FOND planning, addressing more directly the
non-deterministic aspect of FOND planning, and it also exploits the benefits of
heuristic functions to make the algorithm more effective during the iterative
searching process. We compare our proposed algorithm to well-known FOND
planners, and show that it has robust performance over several distinct types
of FOND domains considering different metrics.
- Abstract(参考訳): 完全な可観測非決定論的計画(FOND)は、非決定論的効果を持つ行動を通じて不確実性をモデル化する。
既存のFOND計画アルゴリズムは有効であり、幅広い手法を採用している。
しかし、既存のアルゴリズムの多くは、非決定性とタスクサイズの両方を扱うのに堅牢ではない。
本稿では,FOND計画タスクを解き,強い周期的ポリシーを生成する,反復型深度優先探索アルゴリズムを提案する。
このアルゴリズムは、FOND計画の非決定論的側面をより直接的に扱えるように設計されており、反復探索プロセスにおいてアルゴリズムをより効果的にするためにヒューリスティック関数の利点を利用する。
提案アルゴリズムをよく知られたFONDプランナと比較し、異なる指標を考慮した複数の異なるFONDドメインに対して堅牢な性能を示すことを示す。
関連論文リスト
- Depth-Bounded Epistemic Planning [50.42592219248395]
本稿では,動的てんかん論理に基づく新しい計画法を提案する。
新規性は、計画エージェントの推論の深さを上界bに制限することである。
推論深度の境界b内における解を持つ計画タスクに関して、完全なものであることを示す。
論文 参考訳(メタデータ) (2024-06-03T09:30:28Z) - On Uncertainty Quantification for Near-Bayes Optimal Algorithms [2.622066970118316]
本研究では, タスク分布によって定義されたベイズ後続部を, アルゴリズムを用いてマーチンゲール後続部を構築することにより, 未知だが最適であるベイズ後続部を復元可能であることを示す。
様々な非NNアルゴリズムとNNアルゴリズムに基づく実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-03-28T12:42:25Z) - Provably Efficient Representation Learning with Tractable Planning in
Low-Rank POMDP [81.00800920928621]
部分的に観測可能なマルコフ決定過程(POMDP)における表現学習の研究
まず,不確実性(OFU)に直面した最大推定(MLE)と楽観性を組み合わせた復調性POMDPのアルゴリズムを提案する。
次に、このアルゴリズムをより広範な$gamma$-observable POMDPのクラスで機能させる方法を示す。
論文 参考訳(メタデータ) (2023-06-21T16:04:03Z) - Stochastic Ratios Tracking Algorithm for Large Scale Machine Learning
Problems [0.7614628596146599]
古典的なSGDフレームワークにおける適応的なステップ長選択のための新しいアルゴリズムを提案する。
妥当な条件下では、アルゴリズムは十分に確立された理論的な要件に従ってステップ長を生成する。
このアルゴリズムは,手動チューニングから得られる最良ステップ長に匹敵するステップ長を生成することができることを示す。
論文 参考訳(メタデータ) (2023-05-17T06:22:11Z) - Structural Estimation of Markov Decision Processes in High-Dimensional
State Space with Finite-Time Guarantees [39.287388288477096]
本研究では,実施行動と訪問状態の観測可能な履歴に基づいて,人間エージェントによる動的決定の構造モデルの推定作業を検討する。
この問題には固有のネスト構造があり、内部問題では与えられた報酬関数に対する最適ポリシーが特定され、外部問題では適合度の測定が最大化される。
本研究では,高次元状態空間を扱うための有限時間保証付き単一ループ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-04T00:11:38Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Waypoint Planning Networks [66.72790309889432]
本稿では,ローカルカーネル(A*のような古典的アルゴリズム)と学習アルゴリズムを用いたグローバルカーネルを用いたLSTMに基づくハイブリッドアルゴリズムを提案する。
我々は、WPNとA*を比較し、動き計画ネットワーク(MPNet)やバリューネットワーク(VIN)を含む関連する作業と比較する。
WPN の探索空間は A* よりもかなり小さいが、ほぼ最適な結果が得られることが示されている。
論文 参考訳(メタデータ) (2021-05-01T18:02:01Z) - A bi-level encoding scheme for the clustered shortest-path tree problem
in multifactorial optimization [1.471992435706872]
CluSPT(Clustered Shortest-Path Tree Problem)は、実生活における様々な最適化問題において重要な役割を果たしている。
近年、CluSPTを扱うためにMFEA(Multifactorial Evolutionary Algorithm)が導入されている。
本稿では,MFEAに基づくCluSPTの解法について述べる。
論文 参考訳(メタデータ) (2021-02-12T13:36:07Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z) - Oracle-Efficient Regret Minimization in Factored MDPs with Unknown
Structure [57.90236104782219]
非絶対因子化マルコフ決定過程(FMDP)における後悔の研究
既存の全てのアルゴリズムは、FMDPの因子構造が学習者に事前に知られていると強く仮定する。
後悔を最小限に抑えながらFMDPの構造を学習する最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-13T12:30:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。