論文の概要: Fast and Precise: Adjusting Planning Horizon with Adaptive Subgoal Search
- arxiv url: http://arxiv.org/abs/2206.00702v9
- Date: Wed, 3 Apr 2024 14:49:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 23:57:15.415740
- Title: Fast and Precise: Adjusting Planning Horizon with Adaptive Subgoal Search
- Title(参考訳): 高速かつ高精度:適応的な部分探索による計画水平の調整
- Authors: Michał Zawalski, Michał Tyrolski, Konrad Czechowski, Tomasz Odrzygóźdź, Damian Stachura, Piotr Piękos, Yuhuai Wu, Łukasz Kuciński, Piotr Miłoś,
- Abstract要約: 本稿では,アダプティブサブゴールサーチ(AdaSubS)を提案する。
到達不能なサブゴールを迅速にフィルタリングするために検証機構が使用される。
AdaSubSは3つの複雑な推論タスクにおいて階層的計画アルゴリズムを大幅に上回ることを示す。
- 参考スコア(独自算出の注目度): 15.157605648149685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Complex reasoning problems contain states that vary in the computational cost required to determine a good action plan. Taking advantage of this property, we propose Adaptive Subgoal Search (AdaSubS), a search method that adaptively adjusts the planning horizon. To this end, AdaSubS generates diverse sets of subgoals at different distances. A verification mechanism is employed to filter out unreachable subgoals swiftly, allowing to focus on feasible further subgoals. In this way, AdaSubS benefits from the efficiency of planning with longer subgoals and the fine control with the shorter ones, and thus scales well to difficult planning problems. We show that AdaSubS significantly surpasses hierarchical planning algorithms on three complex reasoning tasks: Sokoban, the Rubik's Cube, and inequality proving benchmark INT.
- Abstract(参考訳): 複雑な推論問題は、優れた行動計画を決定するのに必要な計算コストが異なる状態を含む。
この特性を利用して,アダプティブサブゴールサーチ (AdaSubS) を提案する。
この目的のために、AdaSubSは異なる距離で多様なサブゴールの集合を生成する。
検証機構を用いて、到達不能なサブゴールを迅速にフィルタリングし、さらに実現可能なサブゴールに集中できるようにする。
このように、AdaSubSは、より長いサブゴールによる計画の効率と、より短いサブゴールによるきめ細かい制御の恩恵を受けます。
我々は、AdaSubSが3つの複雑な推論タスク(Sokoban, the Rubik's Cube, and inequality proving benchmark INT)において階層的計画アルゴリズムを大幅に上回っていることを示す。
関連論文リスト
- Planning with OWL-DL Ontologies (Extended Version) [6.767885381740952]
フルパワー表現型DLをサポートするブラックボックスを提案する。
主要なアルゴリズムは、OWLによるPDDLへの計画仕様の書き直しに依存している。
いくつかのドメインからのベンチマークセットの実装を評価した。
論文 参考訳(メタデータ) (2024-08-14T13:27:02Z) - Submodular Framework for Structured-Sparse Optimal Transport [7.030105924295838]
非平衡最適輸送(UOT)は、非正規化対策の柔軟な枠組みとロバスト性により、近年注目を集めている。
本研究では,UOT設定における疎輸送計画の学習(構造化)について検討する。
本稿では,最近検討された平均誤差に基づく UOT を用いた新しい空間制約付き UOT の定式化を提案する。
論文 参考訳(メタデータ) (2024-06-07T13:11:04Z) - Unified Task and Motion Planning using Object-centric Abstractions of
Motion Constraints [56.283944756315066]
本稿では,タスクとモーションプランニングを一つの検索に統一するTAMP手法を提案する。
我々のアプローチは、オフザシェルフAIサーチの計算効率を活用して、物理的に実現可能な計画が得られるような、オブジェクト中心の動作制約の抽象化に基づいている。
論文 参考訳(メタデータ) (2023-12-29T14:00:20Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Hybrid Search for Efficient Planning with Completeness Guarantees [63.02803974708516]
本稿では,離散的な行動空間における完全性を実現するために,部分ゴール探索法を効果的に拡張する手法を提案する。
このソリューションは、高レベルの探索の実践的効率と低レベルの探索の完全性という、両方の世界のベストを達成している。
論文 参考訳(メタデータ) (2023-10-19T15:16:43Z) - AdaPlanner: Adaptive Planning from Feedback with Language Models [56.367020818139665]
大規模言語モデル(LLM)は、最近、シーケンシャルな意思決定タスクの自律的エージェントとして機能する可能性を実証している。
本研究では,LLMエージェントが環境フィードバックに応じて自己生成計画を適応的に改善することのできるクローズドループアプローチであるAdaPlannerを提案する。
幻覚を緩和するために,様々なタスク,環境,エージェント機能にまたがる計画生成を容易にするコードスタイルのLCMプロンプト構造を開発した。
論文 参考訳(メタデータ) (2023-05-26T05:52:27Z) - Subgoal Search For Complex Reasoning Tasks [15.152111664776259]
kSubSは学習されたサブゴールジェネレータで、解に近づき、達成可能なサブゴールの多様性を生み出す。
我々は,3つの挑戦的領域において,$k$-第2ステップのサブゴール生成という単純なアプローチが驚くほど効率的であることを示す。
論文 参考訳(メタデータ) (2021-08-25T12:40:04Z) - Visual scoping operations for physical assembly [0.0]
本稿では,次のサブゴールとして空間領域を交互に定義することで,計画と行動のインターリーブを行う視覚スコープを提案する。
ビジュアルスコーピングは,計算コストのごく一部しか必要とせず,サブゴールプランナーに匹敵するタスク性能を実現する。
論文 参考訳(メタデータ) (2021-06-10T10:50:35Z) - Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot
Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。
このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。
すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文 参考訳(メタデータ) (2020-07-06T05:13:20Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。