論文の概要: Learning Neuro-Symbolic Skills for Bilevel Planning
- arxiv url: http://arxiv.org/abs/2206.10680v1
- Date: Tue, 21 Jun 2022 19:01:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-25 05:41:06.757930
- Title: Learning Neuro-Symbolic Skills for Bilevel Planning
- Title(参考訳): 双方向計画のためのニューロシンボリックスキルの学習
- Authors: Tom Silver, Ashay Athalye, Joshua B. Tenenbaum, Tomas Lozano-Perez,
Leslie Pack Kaelbling
- Abstract要約: 意思決定は、連続したオブジェクト中心の状態、継続的なアクション、長い地平線、まばらなフィードバックを持つロボット環境では難しい。
タスク・アンド・モーション・プランニング(TAMP)のような階層的なアプローチは、意思決定を2つ以上の抽象レベルに分解することでこれらの課題に対処する。
我々の主な貢献は、オペレーターとサンプルラーを組み合わせたパラメータ化警察の学習方法である。
- 参考スコア(独自算出の注目度): 63.388694268198655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decision-making is challenging in robotics environments with continuous
object-centric states, continuous actions, long horizons, and sparse feedback.
Hierarchical approaches, such as task and motion planning (TAMP), address these
challenges by decomposing decision-making into two or more levels of
abstraction. In a setting where demonstrations and symbolic predicates are
given, prior work has shown how to learn symbolic operators and neural samplers
for TAMP with manually designed parameterized policies. Our main contribution
is a method for learning parameterized polices in combination with operators
and samplers. These components are packaged into modular neuro-symbolic skills
and sequenced together with search-then-sample TAMP to solve new tasks. In
experiments in four robotics domains, we show that our approach -- bilevel
planning with neuro-symbolic skills -- can solve a wide range of tasks with
varying initial states, goals, and objects, outperforming six baselines and
ablations. Video: https://youtu.be/PbFZP8rPuGg Code:
https://tinyurl.com/skill-learning
- Abstract(参考訳): 意思決定は、連続的なオブジェクト中心の状態、継続的なアクション、長い地平線、スパースフィードバックを持つロボット環境では難しい。
task and motion planning(tamp)のような階層的アプローチは、意思決定を2つ以上の抽象レベルに分解することで、これらの課題に対処している。
実証と記号述語が与えられる設定において、先行研究は、手動で設計されたパラメータ化されたポリシーで、TAMPの記号演算子とニューラルサンプリングを学習する方法を示している。
我々の主な貢献は、オペレーターとサンプルラーを組み合わせたパラメータ化警察の学習方法である。
これらのコンポーネントはモジュール型ニューロシンボリックスキルにパッケージ化され、新しいタスクを解決するために検索テーマサンプルTAMPと共にシーケンスされる。
4つのロボティクス領域の実験において、我々のアプローチ、すなわちニューロシンボリックスキルを用いたバイレベルプランニングは、様々な初期状態、目標、オブジェクトで幅広いタスクを解決し、6つのベースラインと改善を達成できることを示した。
ビデオ: https://youtu.be/PbFZP8rPuGgコード: https://tinyurl.com/skill-learning
関連論文リスト
- Large Language Models for Orchestrating Bimanual Robots [19.60907949776435]
本稿では,Language-based Bimanual Orchestration (LABOR)を提案する。
NICOLヒューマノイドロボットを用いた2種類の長距離作業のシミュレーション実験により,本手法の評価を行った。
論文 参考訳(メタデータ) (2024-04-02T15:08:35Z) - Mastering Robot Manipulation with Multimodal Prompts through Pretraining and Multi-task Fine-tuning [49.92517970237088]
我々はマルチモーダルなプロンプトを理解するためにロボットを訓練する問題に取り組む。
このようなタスクは、視覚と言語信号の相互接続と相補性を理解するロボットの能力にとって大きな課題となる。
マルチモーダルプロンプトを用いてロボット操作を行うためのポリシーを学習する効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-14T22:24:58Z) - Learning Efficient Abstract Planning Models that Choose What to Predict [28.013014215441505]
多くのロボティクス分野において,既存の記号演算子学習アプローチが不足していることが示されている。
これは主に、抽象状態におけるすべての観測された変化を正確に予測する演算子を学習しようとするためである。
我々は,特定の目標を達成するための抽象的計画に必要な変化をモデル化するだけで,「予測すべきものを選択する」演算子を学習することを提案する。
論文 参考訳(メタデータ) (2022-08-16T13:12:59Z) - Skill-based Multi-objective Reinforcement Learning of Industrial Robot
Tasks with Planning and Knowledge Integration [0.4949816699298335]
本稿では,タスクレベルの計画と,スキルベースシステムにおけるシナリオ固有のパラメータの学習を併用する手法を提案する。
2つの異なる接触豊富なタスクのスキルパラメータを学習することで、アプローチの有効性と汎用性を実証する。
論文 参考訳(メタデータ) (2022-03-18T16:03:27Z) - Combining Modular Skills in Multitask Learning [149.8001096811708]
モジュラー設計は、ニューラルネットワークが様々な知識の面をアンタングルして再結合し、新しいタスクにより系統的に一般化することを奨励する。
この研究では、各タスクは(潜在的に小さな)インベントリから潜在的な離散スキルのサブセットと関連付けられていると仮定する。
ネットワークのモジュラー設計により、強化学習におけるサンプル効率が著しく向上し、教師あり学習における数ショットの一般化が図られる。
論文 参考訳(メタデータ) (2022-02-28T16:07:19Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - Learning Neuro-Symbolic Relational Transition Models for Bilevel
Planning [61.37385221479233]
本研究では,モデルに基づく強化学習と記号幾何学的ロボット計画の統合のギャップを埋めるための一歩を踏み出した。
NSRTはシンボリックコンポーネントとニューラルコンポーネントの両方を持ち、外ループにおけるシンボリックAI計画がインナーループ内のニューラルモデルによる継続的な計画をガイドするバイレベルプランニングスキームを可能にする。
NSRTは、ほんの数十~数百回のトレーニングの後に学習でき、目標を達成するのに最大60のアクションを必要とする新しいタスクの高速計画に使用される。
論文 参考訳(メタデータ) (2021-05-28T19:37:18Z) - Learning Symbolic Operators for Task and Motion Planning [29.639902380586253]
統合されたタスクとモーションプランナー(TAMP)は、モーションレベルの決定とタスクレベルの計画実現性の複雑な相互作用を処理します。
TAMPアプローチは、タスクレベルの検索を導くためにドメイン固有のシンボリック演算子に依存し、計画を効率的にします。
演算子学習のためのボトムアップリレーショナル学習法を提案し,TAMPシステムの計画に学習した演算子をどのように使用できるかを示す。
論文 参考訳(メタデータ) (2021-02-28T19:08:56Z) - Transferable Task Execution from Pixels through Deep Planning Domain
Learning [46.88867228115775]
階層モデルを学ぶために,DPDL(Deep Planning Domain Learning)を提案する。
DPDLは、現在の象徴的世界状態からなる論理述語セットの値を予測する高レベルモデルを学ぶ。
これにより、ロボットが明示的に訓練されていなくても、複雑なマルチステップタスクを実行できます。
論文 参考訳(メタデータ) (2020-03-08T05:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。