論文の概要: Planning as Theorem Proving with Heuristics
- arxiv url: http://arxiv.org/abs/2303.13638v3
- Date: Tue, 20 Jun 2023 02:59:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 03:10:24.392907
- Title: Planning as Theorem Proving with Heuristics
- Title(参考訳): ヒューリスティックスによる定理証明としての計画
- Authors: Mikhail Soutchanski and Ryan Young
- Abstract要約: 状況計算で証明された定理としての計画は50年前に不可能なプロジェクトとして放棄された。
我々は,A*探索を用いて,状況のツリー内のプランを探索するTheorem Proving Lifted Heuristic Plannerを開発した。
- 参考スコア(独自算出の注目度): 1.3706331473063877
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Planning as theorem proving in situation calculus was abandoned 50 years ago
as an impossible project. But we have developed a Theorem Proving Lifted
Heuristic (TPLH) planner that searches for a plan in a tree of situations using
the A* search algorithm. It is controlled by a delete relaxation-based domain
independent heuristic. We compare TPLH with Fast Downward (FD) and Best First
Width Search (BFWS) planners over several standard benchmarks. Since our
implementation of the heuristic function is not optimized, TPLH is slower than
FD and BFWS. But it computes shorter plans, and it explores fewer states. We
discuss previous research on planning within KR\&R and identify related
directions. Thus, we show that deductive lifted heuristic planning in situation
calculus is actually doable.
- Abstract(参考訳): 状況計算における定理証明としての計画は、50年前に不可能プロジェクトとして放棄された。
しかし、我々は、A*探索アルゴリズムを用いて、状況のツリー内のプランを探索するTheorem Proving Lifted Heuristic(TPLH)プランナーを開発した。
削除緩和に基づくドメイン独立ヒューリスティックによって制御される。
我々は,TPLHとFast Downward (FD)とBest First Width Search (BFWS)を,いくつかの標準ベンチマークで比較した。
ヒューリスティック関数の実装は最適化されていないため、TPLHはFDやBFWSよりも遅い。
しかし、短い計画を計算し、少ない州を探索する。
我々は、KR\&R内の計画に関する以前の研究について論じ、関連する方向を特定する。
以上より,状況計算において帰納的揚水ヒューリスティック計画が実際に可能であることを示す。
関連論文リスト
- AlphaZeroES: Direct score maximization outperforms planning loss minimization [61.17702187957206]
実行時の計画では、シングルエージェントとマルチエージェントの両方の設定でエージェントのパフォーマンスが劇的に向上することが示されている。
実行時に計画するアプローチのファミリは、AlphaZeroとその変種で、Monte Carlo Tree Searchと、状態値とアクション確率を予測することによって検索をガイドするニューラルネットワークを使用する。
複数の環境にまたがって、エピソードスコアを直接最大化し、計画損失を最小限に抑えることを示す。
論文 参考訳(メタデータ) (2024-06-12T23:00:59Z) - Depth-Bounded Epistemic Planning [50.42592219248395]
本稿では,動的てんかん論理に基づく新しい計画法を提案する。
新規性は、計画エージェントの推論の深さを上界bに制限することである。
推論深度の境界b内における解を持つ計画タスクに関して、完全なものであることを示す。
論文 参考訳(メタデータ) (2024-06-03T09:30:28Z) - Optimize Planning Heuristics to Rank, not to Estimate Cost-to-Goal [0.9217021281095907]
計画のための模倣学習では、関数のパラメータは一連の解決された問題インスタンスに対して最適化される。
次に、フォワード探索アルゴリズムの与えられた変種に合わせたランキングに基づいて、損失関数の族を提案する。
様々な問題の集合に関する実験的な比較は、導出理論を絶対的に支持する。
論文 参考訳(メタデータ) (2023-10-30T11:39:49Z) - Plausibility-Based Heuristics for Latent Space Classical Planning [7.538482310185133]
可塑性に基づくヒューリスティックスは, 画像ベースタイルパズルタワーの有効計画数を大幅に増加させることを示す。
論文 参考訳(メタデータ) (2023-06-20T10:26:29Z) - MultiZenoTravel: a Tunable Benchmark for Multi-Objective Planning with
Known Pareto Front [71.19090689055054]
多目的AI計画では、既知のPareto Frontsを示すベンチマークが不足している。
提案するベンチマーク生成器と専用ソルバは、結果のインスタンスの真のParetoを確実に計算する。
本稿では,制約された問題に対して最適な計画を示すとともに,制約された問題に対する一般的な問題を減らす方法を示す。
論文 参考訳(メタデータ) (2023-04-28T07:09:23Z) - IBBT: Informed Batch Belief Trees for Motion Planning Under Uncertainty [15.472200104646447]
本研究では,動作計画と不確実性検出のためのIBBTアルゴリズムを提案する。
IBBTは、バッチ状態サンプリング、名目上の軌道構築、計算、およびグラフ上の探索の間でインターリーブし、信念空間の運動計画を見つける。
IBBTは非自明な動作計画を発見し,従来の類似手法と比較して高速であることを確認した。
論文 参考訳(メタデータ) (2023-04-21T14:31:19Z) - Human-in-the-loop: Provably Efficient Preference-based Reinforcement
Learning with General Function Approximation [107.54516740713969]
本研究は,RL(Human-in-the-loop reinforcement learning)を軌道的嗜好で検討する。
各ステップで数値的な報酬を受ける代わりに、エージェントは人間の監督者から軌道上のペアよりも優先される。
一般関数近似を用いたPbRLの楽観的モデルベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-23T09:03:24Z) - PDE-Based Optimal Strategy for Unconstrained Online Learning [40.61498562988079]
部分微分方程式(PDE)を解くことによって時間変化ポテンシャル関数を生成するフレームワークを提案する。
我々のフレームワークは、いくつかの古典的なポテンシャルを回復し、より重要なことは、新しいものを設計するための体系的なアプローチを提供する。
これは最適なリード定数を持つ最初のパラメータフリーアルゴリズムである。
論文 参考訳(メタデータ) (2022-01-19T22:21:21Z) - Eigencurve: Optimal Learning Rate Schedule for SGD on Quadratic
Objectives with Skewed Hessian Spectrums [26.44093918424658]
Eigencurveは、2次目的のSGDの最小収束率(定数まで)を達成することができる学習率スケジュールの最初のファミリーである。
実験結果から,Eigencurveは画像分類タスクにおいて,ステップ崩壊を著しく上回り得ることが示された。
実用的な応用のための2つの単純な学習率スケジューラは、Eigencurveを近似することができる。
論文 参考訳(メタデータ) (2021-10-27T01:17:53Z) - Waypoint Planning Networks [66.72790309889432]
本稿では,ローカルカーネル(A*のような古典的アルゴリズム)と学習アルゴリズムを用いたグローバルカーネルを用いたLSTMに基づくハイブリッドアルゴリズムを提案する。
我々は、WPNとA*を比較し、動き計画ネットワーク(MPNet)やバリューネットワーク(VIN)を含む関連する作業と比較する。
WPN の探索空間は A* よりもかなり小さいが、ほぼ最適な結果が得られることが示されている。
論文 参考訳(メタデータ) (2021-05-01T18:02:01Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。