論文の概要: Heuristic Search for Multi-Objective Probabilistic Planning
- arxiv url: http://arxiv.org/abs/2303.14363v1
- Date: Sat, 25 Mar 2023 05:18:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 20:22:17.524205
- Title: Heuristic Search for Multi-Objective Probabilistic Planning
- Title(参考訳): 多目的確率計画のためのヒューリスティック探索
- Authors: Dillon Chen, Felipe Trevizan, Sylvie Thi\'ebaux
- Abstract要約: ヒューリスティック検索は、幅広い計画問題にうまく適用された強力なアプローチである。
ここでは、探索の範囲をより多くの問題、すなわちMOSSP(Multi-jective shortest paths)に拡張する。
我々は、よく知られたSSPアルゴリズムを多目的問題に拡張するMOLAO* と MOLRTDP を設計する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heuristic search is a powerful approach that has successfully been applied to
a broad class of planning problems, including classical planning,
multi-objective planning, and probabilistic planning modelled as a stochastic
shortest path (SSP) problem. Here, we extend the reach of heuristic search to a
more expressive class of problems, namely multi-objective stochastic shortest
paths (MOSSPs), which require computing a coverage set of non-dominated
policies. We design new heuristic search algorithms MOLAO* and MOLRTDP, which
extend well-known SSP algorithms to the multi-objective case. We further
construct a spectrum of domain-independent heuristic functions differing in
their ability to take into account the stochastic and multi-objective features
of the problem to guide the search. Our experiments demonstrate the benefits of
these algorithms and the relative merits of the heuristics.
- Abstract(参考訳): ヒューリスティック・サーチは、古典的計画、多目的計画、確率的最短経路(SSP)問題としてモデル化された確率的計画など、幅広い計画問題に適用された強力なアプローチである。
ここでは、ヒューリスティック検索の到達範囲を、より表現力のあるクラス、すなわちマルチオブジェクト確率的最短経路(MOSSP)に拡張し、非支配的なポリシーのカバレッジを計算する必要がある。
我々は、よく知られたSSPアルゴリズムを多目的ケースに拡張する新しいヒューリスティック検索アルゴリズムMOLAO*とMOLRTDPを設計する。
探索を導く問題の確率的・多目的的特徴を考慮に入れる能力が異なる領域非依存ヒューリスティック関数のスペクトルを更に構築する。
実験ではこれらのアルゴリズムの利点とヒューリスティックスの相対的なメリットを実証した。
関連論文リスト
- Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - Efficient Model-Free Exploration in Low-Rank MDPs [76.87340323826945]
低ランクマルコフ決定プロセスは、関数近似を持つRLに対して単純だが表現力のあるフレームワークを提供する。
既存のアルゴリズムは、(1)計算的に抽出可能であるか、または(2)制限的な統計的仮定に依存している。
提案手法は,低ランクMPPの探索のための最初の実証可能なサンプル効率アルゴリズムである。
論文 参考訳(メタデータ) (2023-07-08T15:41:48Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - Multi-objective Conflict-based Search Using Safe-interval Path Planning [10.354181009277623]
低レベル探索のための新しい多目的セーフインターバルパス計画法 (MO-SIPP) アルゴリズムを利用するMO-CBS(Multi-objective conflict-based search)を提案する。
我々は, 平均低レベル探索時間において, 等級が大幅に改善されていることを示すために, 広範囲な数値計算結果を示す。
また,建設現場計画における提案アルゴリズムの適用可能性を示すケーススタディも提示する。
論文 参考訳(メタデータ) (2021-08-02T09:42:08Z) - A Unified View of Algorithms for Path Planning Using Probabilistic
Inference on Factor Graphs [2.4874504720536317]
この研究は、様々なコスト関数から生じる特定の再帰について考察し、スコープに類似しているように見えるが、少なくとも典型的な経路計画問題に適用した場合に違いがある。
確率空間とログ空間の両方で提示されるこの統一されたアプローチは、Sum-product、Max-product、Dynamic Programming、混合Reward/Entropy基準に基づくアルゴリズムを含む非常に一般的なフレームワークを提供する。
論文 参考訳(メタデータ) (2021-06-19T07:13:15Z) - Selection-Expansion: A Unifying Framework for Motion-Planning and
Diversity Search Algorithms [69.87173070473717]
本稿では,2つの多様性探索アルゴリズム,ノベルティ探索アルゴリズムとゴール探索処理アルゴリズムの特性について検討する。
mpアルゴリズムとの関係は、ポリシーパラメータ空間と結果空間の間のマッピングの滑らかさ、あるいは滑らかさの欠如が検索効率において重要な役割を担っていることを示している。
論文 参考訳(メタデータ) (2021-04-10T13:52:27Z) - Multi-objective Conflict-based Search for Multi-agent Path Finding [10.354181009277623]
マルチオブジェクトパスプランナーは通常、パスの長さなどの単一の目的を最適化しながら、パスのアンサンブルを計算します。
本稿では、マルチオブジェクトコンフリクトベース検索(MO-CBS)という、いわゆる次元の呪いをバイパスする手法を紹介します。
論文 参考訳(メタデータ) (2021-01-11T10:42:38Z) - Learning Heuristic Selection with Dynamic Algorithm Configuration [44.91083687014879]
計画システムの動的選択力学に動的アルゴリズム構成を用いることができることを示す。
提案手法は,既存のアプローチよりも一般化し,ドメイン探索の性能を指数関数的に向上させることができることを示す。
論文 参考訳(メタデータ) (2020-06-15T09:35:07Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z) - Flexible and Efficient Long-Range Planning Through Curious Exploration [13.260508939271764]
The Curious Sample Planner can realize temporallyextended plan for a wide range of really 3D task。
対照的に、標準的な計画と学習の方法は、多くの場合、これらのタスクを全く解決しなかったり、膨大な数のトレーニングサンプルでのみ実行できなかったりします。
論文 参考訳(メタデータ) (2020-04-22T21:47:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。