論文の概要: Active Learning of Abstract Plan Feasibility
- arxiv url: http://arxiv.org/abs/2107.00683v1
- Date: Thu, 1 Jul 2021 18:17:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-05 12:47:15.794831
- Title: Active Learning of Abstract Plan Feasibility
- Title(参考訳): 抽象計画実現可能性のアクティブラーニング
- Authors: Michael Noseworthy, Caris Moses, Isaiah Brand, Sebastian Castro,
Leslie Kaelbling, Tom\'as Lozano-P\'erez, Nicholas Roy
- Abstract要約: 本稿では,タスクに依存しない,好奇心を抱くロボットの探索を通じて,APF予測器を効率的に取得するための能動的学習手法を提案する。
アクティブラーニング戦略において,本システムでは,本システムでより少ないデータから学習できるように,実用不可能なサブシーケンス特性を活用して,候補計画の立案を行う。
物体が一様でない質量分布を持つ積層領域において,本システムは,400個の自己教師による相互作用において,APFモデルの実際のロボット学習を可能にすることを示す。
- 参考スコア(独自算出の注目度): 17.689758291966502
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long horizon sequential manipulation tasks are effectively addressed
hierarchically: at a high level of abstraction the planner searches over
abstract action sequences, and when a plan is found, lower level motion plans
are generated. Such a strategy hinges on the ability to reliably predict that a
feasible low level plan will be found which satisfies the abstract plan.
However, computing Abstract Plan Feasibility (APF) is difficult because the
outcome of a plan depends on real-world phenomena that are difficult to model,
such as noise in estimation and execution. In this work, we present an active
learning approach to efficiently acquire an APF predictor through
task-independent, curious exploration on a robot. The robot identifies plans
whose outcomes would be informative about APF, executes those plans, and learns
from their successes or failures. Critically, we leverage an infeasible
subsequence property to prune candidate plans in the active learning strategy,
allowing our system to learn from less data. We evaluate our strategy in
simulation and on a real Franka Emika Panda robot with integrated perception,
experimentation, planning, and execution. In a stacking domain where objects
have non-uniform mass distributions, we show that our system permits real robot
learning of an APF model in four hundred self-supervised interactions, and that
our learned model can be used effectively in multiple downstream tasks.
- Abstract(参考訳): 高レベルの抽象化では、プランナーが抽象的なアクションシーケンスを探索し、プランが見つかると、下位レベルのモーションプランが生成される。
このような戦略は、抽象的な計画を満たす実現可能な低レベル計画が見つかると確実に予測できる能力にかかっている。
しかし、計画の結果は推定や実行のノイズなどモデル化が難しい実世界現象に依存するため、抽象計画実現可能性(apf)の計算は困難である。
本稿では,ロボットのタスクに依存しない,好奇心の強い探索を通じてapf予測を効率的に獲得するためのアクティブラーニング手法を提案する。
ロボットはapfに関する情報を得られるであろう計画を特定し、その計画を実行し、成功や失敗から学ぶ。
批判的に,本システムでは,アクティブラーニング戦略における候補計画の立案に実用不可能なサブシーケンス特性を活用し,少ないデータから学習することができる。
我々は,シミュレーションと実物のフランカ・エミカ・パンダロボットを用いて,統合された認識,実験,計画,実行の戦略を評価する。
物体が一様でない質量分布を持つ積層領域において、本システムは、400個の自己教師付き相互作用においてAPFモデルの実際のロボット学習を可能にし、学習モデルを複数の下流タスクで効果的に利用できることを示す。
関連論文リスト
- KnowAgent: Knowledge-Augmented Planning for LLM-Based Agents [54.09074527006576]
大規模言語モデル(LLM)は複雑な推論タスクにおいて大きな可能性を証明していますが、より高度な課題に取り組むには不十分です。
この不適切さは、主に言語エージェントのアクション知識が組み込まれていないことに起因する。
我々は、明示的な行動知識を取り入れることで、LLMの計画能力を高めるために設計された新しいアプローチであるKnowAgentを紹介する。
論文 参考訳(メタデータ) (2024-03-05T16:39:12Z) - Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Learning to Reason over Scene Graphs: A Case Study of Finetuning GPT-2
into a Robot Language Model for Grounded Task Planning [45.51792981370957]
本研究では,ロボットタスク計画における小クラス大規模言語モデル(LLM)の適用性について,計画立案者が順次実行するためのサブゴール仕様にタスクを分解することを学ぶことによって検討する。
本手法は,シーングラフとして表現される領域上でのLLMの入力に基づいて,人間の要求を実行可能なロボット計画に変換する。
本研究は,LLMに格納された知識を長期タスクプランニングに効果的に活用できることを示唆し,ロボット工学におけるニューロシンボリックプランニング手法の今後の可能性を示すものである。
論文 参考訳(メタデータ) (2023-05-12T18:14:32Z) - Efficient Learning of High Level Plans from Play [57.29562823883257]
本稿では,移動計画と深いRLを橋渡しするロボット学習のフレームワークであるELF-Pについて紹介する。
ELF-Pは、複数の現実的な操作タスクよりも、関連するベースラインよりもはるかに優れたサンプル効率を有することを示す。
論文 参考訳(メタデータ) (2023-03-16T20:09:47Z) - Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。
同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。
実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T15:04:39Z) - Achieving mouse-level strategic evasion performance using real-time
computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。
我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文 参考訳(メタデータ) (2022-11-04T18:34:36Z) - Inventing Relational State and Action Abstractions for Effective and
Efficient Bilevel Planning [26.715198108255162]
我々は状態と行動の抽象化を学習するための新しいフレームワークを開発する。
我々は、対象のアイデンティティや数値を一般化するリレーショナル、ニューロシンボリックな抽象化を学ぶ。
学習した抽象化によって、より長い地平線のホールドアウトタスクを迅速に解決できることが示されています。
論文 参考訳(メタデータ) (2022-03-17T22:13:09Z) - Using Deep Learning to Bootstrap Abstractions for Hierarchical Robot
Planning [27.384742641275228]
階層的な計画プロセス全体をブートストラップするための新しいアプローチを提案する。
これは、新しい環境に対する抽象状態とアクションが自動的に計算される方法を示している。
学習した抽象概念を、新しいマルチソース双方向階層型ロボット計画アルゴリズムに用いている。
論文 参考訳(メタデータ) (2022-02-02T08:11:20Z) - Self-Imitation Learning by Planning [3.996275177789895]
模擬学習(IL)により、熟練の知識を伝達することで、ロボットがスキルを素早く習得できます。
長期移動計画タスクでは、ILおよびRLメソッドのデプロイにおける課題は、大規模で広範囲に分散したデータの生成と収集方法である。
本研究では,現在の方針から訪問状態の計画により,実演データを自動収集する自己模倣学習(silp)を提案する。
SILPは、早期強化学習の段階で正常に訪問された状態がグラフ検索ベースのモーションプランナーの衝突のないノードであることに触発されます。
論文 参考訳(メタデータ) (2021-03-25T13:28:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。