論文の概要: Efficient Black-Box Planning Using Macro-Actions with Focused Effects
- arxiv url: http://arxiv.org/abs/2004.13242v3
- Date: Wed, 23 Jun 2021 19:38:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 21:59:49.725284
- Title: Efficient Black-Box Planning Using Macro-Actions with Focused Effects
- Title(参考訳): 集中効果を持つマクロアクションを用いた効率的なブラックボックス計画
- Authors: Cameron Allen, Michael Katz, Tim Klinger, George Konidaris, Matthew
Riemer, Gerald Tesauro
- Abstract要約: ヒューリスティックスは検索をより効率的にするが、ブラックボックスの計画にはゴールを意識する。
我々は、ゴール数をより正確にするマクロアクションを発見することによって、この制限を克服する方法を示す。
- 参考スコア(独自算出の注目度): 35.688161278362735
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The difficulty of deterministic planning increases exponentially with
search-tree depth. Black-box planning presents an even greater challenge, since
planners must operate without an explicit model of the domain. Heuristics can
make search more efficient, but goal-aware heuristics for black-box planning
usually rely on goal counting, which is often quite uninformative. In this
work, we show how to overcome this limitation by discovering macro-actions that
make the goal-count heuristic more accurate. Our approach searches for
macro-actions with focused effects (i.e. macros that modify only a small number
of state variables), which align well with the assumptions made by the
goal-count heuristic. Focused macros dramatically improve black-box planning
efficiency across a wide range of planning domains, sometimes beating even
state-of-the-art planners with access to a full domain model.
- Abstract(参考訳): 決定論的計画の難しさは探索木深度とともに指数関数的に増加する。
ブラックボックスプランニングは、プランナーがドメインの明示的なモデルなしで運用する必要があるため、さらに大きな課題となる。
ヒューリスティックは検索をより効率的にするが、ブラックボックス計画のための目標認識ヒューリスティックは通常ゴールカウントに依存している。
本稿では,目標数ヒューリスティックをより正確にするマクロアクションの発見によって,この制限を克服する方法を示す。
提案手法は,目標数ヒューリスティックによる仮定とよく一致した,集中した効果(つまり少数の状態変数のみを修飾するマクロ)を持つマクロアクションを探索する。
フォーカスされたマクロは、幅広い計画領域におけるブラックボックス計画効率を劇的に改善し、時には完全なドメインモデルへのアクセスで最先端のプランナーを圧倒する。
関連論文リスト
- Tree-Planner: Efficient Close-loop Task Planning with Large Language Models [63.06270302774049]
Tree-Plannerは、大きな言語モデルでタスクプランニングを3つの異なるフェーズに再構成する。
Tree-Plannerは高い効率を維持しながら最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-10-12T17:59:50Z) - AlphaBlock: Embodied Finetuning for Vision-Language Reasoning in Robot
Manipulation [50.737355245505334]
本稿では,ロボット操作タスクにおける高レベル認知能力を学習するための新しいフレームワークを提案する。
得られたデータセットAlphaBlockは、多段階のテキストプランとペア観測による35の包括的なハイレベルタスクで構成されている。
論文 参考訳(メタデータ) (2023-05-30T09:54:20Z) - Online Tool Selection with Learned Grasp Prediction Models [15.915410623440875]
深層学習に基づく把握予測モデルは、ロボットビンピッキングシステムの業界標準となっている。
ピックの成功を最大化するために、生産環境は、しばしばターゲットオブジェクトに基づいて、オンザフライで交換できるいくつかのエンドエフェクタツールを備えている。
システムスループットを改善するために、グリップの順序、およびそれに対応するツール変更アクションをどのように選択するかを示す。
論文 参考訳(メタデータ) (2023-02-15T20:52:38Z) - Bayesian Optimization for Macro Placement [48.55456716632735]
本研究では,系列対上のベイズ最適化(BO)を用いた新しいマクロ配置法を提案する。
BOは確率的代理モデルと獲得関数を利用する機械学習技術である。
固定アウトラインマクロ配置問題に対して, 半周波線長目標を用いたアルゴリズムを実証する。
論文 参考訳(メタデータ) (2022-07-18T06:17:06Z) - Multi-Target Active Object Tracking with Monte Carlo Tree Search and
Target Motion Modeling [126.26121580486289]
本研究は,マルチターゲットアクティブオブジェクトトラッキング(AOT)に重点を置いており,複数のターゲットと環境に複数のカメラが配置されている。
目標は、全カメラの全体的な対象範囲を最大化することです。
スポーツゲームをシミュレートするマルチターゲット2D環境を構築し,本手法が対象範囲を効果的に改善できることを示す実験結果を得た。
論文 参考訳(メタデータ) (2022-05-07T05:08:15Z) - Symbolic Search for Optimal Planning with Expressive Extensions [4.36572039512405]
計画問題のいくつかの性質は、それらを捕捉しモデル化するために標準的な古典的計画形式を表現的に拡張する必要がある。
公理による計画、国家依存の行動コストによる計画、過剰加入計画、トップk計画について検討する。
論文 参考訳(メタデータ) (2022-04-01T08:41:06Z) - MAGIC: Learning Macro-Actions for Online POMDP Planning [14.156697390568617]
MAGICは、オンラインプランナーのパフォーマンスをフィードバックとして、マクロアクションジェネレータをエンドツーエンドで学習する。
我々は、シミュレーションと実ロボットの両方において、複数の長期計画タスクにおいてMAGICを評価する。
論文 参考訳(メタデータ) (2020-11-07T17:18:45Z) - Planning with Learned Object Importance in Large Problem Instances using
Graph Neural Networks [28.488201307961624]
現実の計画問題は、数百から数千ものオブジェクトを巻き込むことが多い。
単一推論パスにおけるオブジェクトの重要性を予測するためのグラフニューラルネットワークアーキテクチャを提案する。
提案手法では,プランナと遷移モデルをブラックボックスとして扱い,既製のプランナで使用することができる。
論文 参考訳(メタデータ) (2020-09-11T18:55:08Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。