論文の概要: Scaling-up Generalized Planning as Heuristic Search with Landmarks
- arxiv url: http://arxiv.org/abs/2205.04850v1
- Date: Tue, 10 May 2022 12:42:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 18:48:21.338954
- Title: Scaling-up Generalized Planning as Heuristic Search with Landmarks
- Title(参考訳): ランドマークによるヒューリスティック検索としての一般化計画のスケールアップ
- Authors: Javier Segovia-Aguas, Sergio Jim\'enez, Anders Jonsson and Laura
Sebasti\'a
- Abstract要約: 一般化計画は通常、与えられたアルゴリズム的解の空間における探索として扱われる。
この種のソリューション評価は、計画インスタンスの表現において明示されていないどんなサブゴール情報も無視する。
GPのノード拡張は、古典的なプランニングインスタンスのバッチ全体にわたってすべての子ノードを評価する必要があるため、実行時のボトルネックである。
- 参考スコア(独自算出の注目度): 9.653976364051564
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Landmarks are one of the most effective search heuristics for classical
planning, but largely ignored in generalized planning. Generalized planning
(GP) is usually addressed as a combinatorial search in a given space of
algorithmic solutions, where candidate solutions are evaluated w.r.t.~the
instances they solve. This type of solution evaluation ignores any sub-goal
information that is not explicit in the representation of the planning
instances, causing plateaus in the space of candidate generalized plans.
Furthermore, node expansion in GP is a run-time bottleneck since it requires
evaluating every child node over the entire batch of classical planning
instances in a GP problem. In this paper we define a landmark counting
heuristic for GP (that considers sub-goal information that is not explicitly
represented in the planning instances), and a novel heuristic search algorithm
for GP (that we call PGP) and that progressively processes subsets of the
planning instances of a GP problem. Our two orthogonal contributions are
analyzed in an ablation study, showing that both improve the state-of-the-art
in GP as heuristic search, and that both benefit from each other when used in
combination.
- Abstract(参考訳): ランドマークは古典的計画において最も効果的な探索ヒューリスティックの一つであるが、一般的な計画では無視されている。
一般計画 (GP) は通常、アルゴリズム解の所定の空間における組合せ探索として扱われ、候補解が w.r.t. で評価される。
このタイプのソリューション評価は、計画インスタンスの表現において明示されていない任意のサブゴール情報を無視し、候補一般化計画の空間にプラトーを引き起こす。
さらに、gpのノード拡張は、gp問題の古典的なプランニングインスタンスのバッチ全体を通して全ての子ノードを評価する必要があるため、実行時のボトルネックである。
本稿では,GP の目覚ましい数的ヒューリスティック (計画インスタンスに明示的に表されていない部分ゴール情報を考える) と,GP の新たなヒューリスティック検索アルゴリズム (PGP と呼ぶ) を定義し,GP 問題の計画インスタンスのサブセットを段階的に処理する。
この2つの直交的貢献はアブレーション研究で分析され、gpの最先端をヒューリスティック探索として改善し、両者が組み合わせて使うと互いに利益を得ることが示された。
関連論文リスト
- Scaling Gaussian Process Optimization by Evaluating a Few Unique
Candidates Multiple Times [119.41129787351092]
GPに基づく逐次ブラックボックス最適化は,複数の評価ステップの候補解に固執することで効率よく行うことができることを示す。
GP-UCB と GP-EI の2つのよく確立されたGP-Opt アルゴリズムを改良し,バッチ化された GP-Opt の規則を適応させる。
論文 参考訳(メタデータ) (2022-01-30T20:42:14Z) - Frequent Itemset-driven Search for Finding Minimum Node Separators in
Complex Networks [61.2383572324176]
本稿では,データマイニングにおける頻繁なアイテムセットマイニングの概念をよく知られたメメティック検索フレームワークに統合する,頻繁なアイテムセット駆動探索手法を提案する。
頻繁なアイテムセット組換え演算子を反復的に使用して、高品質なソリューションで頻繁に発生するアイテムセットに基づいた有望な子孫ソリューションを生成する。
特に、29個の新しい上界を発見し、以前の18個の最もよく知られた境界と一致する。
論文 参考訳(メタデータ) (2022-01-18T11:16:40Z) - Planning in Observable POMDPs in Quasipolynomial Time [21.03037504572896]
我々は観測可能なPOMDPの計画のための準ポリノミカル時間アルゴリズムを開発した。
我々は、状態上のよく分断された分布が観察上のよく分断された分布をもたらすと仮定する。
観測可能なPOMDPの指数時間仮説の下での計画に適合する硬さを実証する。
論文 参考訳(メタデータ) (2022-01-12T23:16:37Z) - Robust and Adaptive Temporal-Difference Learning Using An Ensemble of
Gaussian Processes [70.80716221080118]
本稿では、時間差学習(TD)による政策評価の世代的視点について考察する。
OS-GPTDアプローチは、状態-逆ペアのシーケンスを観測することにより、与えられたポリシーの値関数を推定するために開発された。
1つの固定カーネルに関連する限られた表現性を緩和するために、GP前の重み付けアンサンブル(E)を用いて代替のスキームを生成する。
論文 参考訳(メタデータ) (2021-12-01T23:15:09Z) - Non-Gaussian Gaussian Processes for Few-Shot Regression [71.33730039795921]
乱変数ベクトルの各成分上で動作し,パラメータを全て共有する可逆なODEベースのマッピングを提案する。
NGGPは、様々なベンチマークとアプリケーションに対する競合する最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2021-10-26T10:45:25Z) - Incremental Ensemble Gaussian Processes [53.3291389385672]
本稿では,EGPメタラーナーがGP学習者のインクリメンタルアンサンブル(IE-) GPフレームワークを提案し,それぞれが所定のカーネル辞書に属するユニークなカーネルを持つ。
各GP専門家は、ランダムな特徴ベースの近似を利用してオンライン予測とモデル更新を行い、そのスケーラビリティを生かし、EGPメタラーナーはデータ適応重みを生かし、熟練者ごとの予測を合成する。
新たなIE-GPは、EGPメタラーナーおよび各GP学習者内における構造化力学をモデル化することにより、時間変化関数に対応するように一般化される。
論文 参考訳(メタデータ) (2021-10-13T15:11:25Z) - Safe-Planner: A Single-Outcome Replanner for Computing Strong Cyclic
Policies in Fully Observable Non-Deterministic Domains [0.22940141855172028]
我々は、古典的ドメインの集合に非決定論的ドメインをコンパイルするために、単一出力決定に依存する、Safe-Plannerと呼ばれるオフラインのリプランナーを導入する。
実験により,この手法により,SPは誤った計画の生成を回避できるが,強い解に直結する弱い計画を生成することができることを示した。
論文 参考訳(メタデータ) (2021-09-23T16:20:35Z) - Waypoint Planning Networks [66.72790309889432]
本稿では,ローカルカーネル(A*のような古典的アルゴリズム)と学習アルゴリズムを用いたグローバルカーネルを用いたLSTMに基づくハイブリッドアルゴリズムを提案する。
我々は、WPNとA*を比較し、動き計画ネットワーク(MPNet)やバリューネットワーク(VIN)を含む関連する作業と比較する。
WPN の探索空間は A* よりもかなり小さいが、ほぼ最適な結果が得られることが示されている。
論文 参考訳(メタデータ) (2021-05-01T18:02:01Z) - Generalized Planning as Heuristic Search [12.160708336715489]
本稿では,計画を探索パラダイムとして一般化計画(gp)の特質に適用する。
本稿では,GP問題における計画インスタンスの数と,これらのインスタンスのサイズに依存しない,新しいGPソリューション空間を定義する。
最後に,BFGP(Best-First Generalized Planning)と呼ばれるGPアルゴリズムを定義し,評価・ヒューリスティック関数によって導かれる解空間において,ベストファーストな探索を行う。
論文 参考訳(メタデータ) (2021-03-26T12:35:10Z) - Learning General Policies from Small Examples Without Supervision [18.718037284357834]
一般化計画は、計画ドメインの複数のインスタンスを一度に解決する一般的なポリシーの計算に関するものです。
近年、これらのポリシーは2つのステップで計算可能であることが示されている。まず、定性的数値計画問題(QNP)の形で適切な抽象化をサンプル計画から学習する。
本稿では,サンプルプランやqnpプランナーを必要とせず,より表現力のある汎用ポリシーを計算するための代替手法を提案する。
論文 参考訳(メタデータ) (2021-01-03T19:44:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。