論文の概要: Learning Neuro-Symbolic Relational Transition Models for Bilevel
Planning
- arxiv url: http://arxiv.org/abs/2105.14074v1
- Date: Fri, 28 May 2021 19:37:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 17:35:45.243213
- Title: Learning Neuro-Symbolic Relational Transition Models for Bilevel
Planning
- Title(参考訳): バイレベル計画のためのニューロシンボリック関係遷移モデルの学習
- Authors: Rohan Chitnis, Tom Silver, Joshua B. Tenenbaum, Tomas Lozano-Perez,
Leslie Pack Kaelbling
- Abstract要約: 本研究では,モデルに基づく強化学習と記号幾何学的ロボット計画の統合のギャップを埋めるための一歩を踏み出した。
NSRTはシンボリックコンポーネントとニューラルコンポーネントの両方を持ち、外ループにおけるシンボリックAI計画がインナーループ内のニューラルモデルによる継続的な計画をガイドするバイレベルプランニングスキームを可能にする。
NSRTは、ほんの数十~数百回のトレーニングの後に学習でき、目標を達成するのに最大60のアクションを必要とする新しいタスクの高速計画に使用される。
- 参考スコア(独自算出の注目度): 61.37385221479233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite recent, independent progress in model-based reinforcement learning
and integrated symbolic-geometric robotic planning, synthesizing these
techniques remains challenging because of their disparate assumptions and
strengths. In this work, we take a step toward bridging this gap with
Neuro-Symbolic Relational Transition Models (NSRTs), a novel class of
transition models that are data-efficient to learn, compatible with powerful
robotic planning methods, and generalizable over objects. NSRTs have both
symbolic and neural components, enabling a bilevel planning scheme where
symbolic AI planning in an outer loop guides continuous planning with neural
models in an inner loop. Experiments in four robotic planning domains show that
NSRTs can be learned after only tens or hundreds of training episodes, and then
used for fast planning in new tasks that require up to 60 actions to reach the
goal and involve many more objects than were seen during training. Video:
https://tinyurl.com/chitnis-nsrts
- Abstract(参考訳): 近年、モデルに基づく強化学習と記号幾何学的ロボット計画の統合が独立した進歩を遂げているにもかかわらず、これらの手法の合成は異なる仮定と強みのために難しいままである。
本研究では,このギャップをニューロシンボリック・リレーショナル・トランジション・モデル(nsrts)と橋渡しする。これは,学習に効率的で,強力なロボット計画手法に適合し,オブジェクト上で一般化可能な,新たなトランジッション・モデルである。
NSRTはシンボリックコンポーネントとニューラルコンポーネントの両方を持ち、外ループにおけるシンボリックAI計画がインナーループ内のニューラルモデルによる継続的な計画をガイドするバイレベルプランニングスキームを可能にする。
4つのロボット計画領域での実験では、nsrtは数十から数百のトレーニングエピソードの後に学習でき、ゴールに到達するのに最大60のアクションが必要で、トレーニング中に見られた多くのオブジェクトを含む新しいタスクの高速計画に使うことができる。
ビデオ: https://tinyurl.com/chitnis-nsrts
関連論文リスト
- Simple and Effective Transfer Learning for Neuro-Symbolic Integration [54.27778591338189]
この問題の潜在的な解決策はNeuro-Symbolic Integration (NeSy)であり、ニューラルアプローチとシンボリック推論を組み合わせる。
これらの手法のほとんどは、認識をシンボルにマッピングするニューラルネットワークと、下流タスクの出力を予測する論理的論理的推論を利用する。
それらは、緩やかな収束、複雑な知覚タスクの学習困難、局所的なミニマへの収束など、いくつかの問題に悩まされている。
本稿では,これらの問題を改善するための簡易かつ効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-02-21T15:51:01Z) - Hebbian Learning based Orthogonal Projection for Continual Learning of
Spiking Neural Networks [74.3099028063756]
我々は,側方接続とヘビアン学習に基づくニューラル操作を用いた新しい手法を開発した。
我々は,反復する側方接続におけるヘビアン学習と反ヘビアン学習が,神経活動の主部分空間を効果的に抽出できることを示した。
我々の手法は、ほとんど忘れることなくニューラルネットワークをスパイクするために一貫して解決する。
論文 参考訳(メタデータ) (2024-02-19T09:29:37Z) - A Unified, Scalable Framework for Neural Population Decoding [12.052847252465826]
神経活動の集団動態をモデル化するためのトレーニングフレームワークとアーキテクチャを導入する。
我々は,ヒト以外の霊長類7種の大規模データセットに基づいて訓練された大規模マルチセッションモデルを構築した。
論文 参考訳(メタデータ) (2023-10-24T17:58:26Z) - Contrastive-Signal-Dependent Plasticity: Forward-Forward Learning of
Spiking Neural Systems [73.18020682258606]
我々は、ニューロンの個々の層が並列に機能する、スパイキングニューロンユニットからなる神経模倣アーキテクチャを開発する。
コントラスト信号依存塑性(CSDP)と呼ばれるイベントベース前方学習の一般化を提案する。
いくつかのパターンデータセットに対する実験結果から,CSDPプロセスは分類と再構成の両方が可能な動的再帰スパイクネットワークのトレーニングに有効であることが示された。
論文 参考訳(メタデータ) (2023-03-30T02:40:28Z) - Fast Kinodynamic Planning on the Constraint Manifold with Deep Neural
Networks [29.239926645660823]
本稿では,制約多様体の概念を利用した新しい学習計画フレームワークを提案する。
我々の手法は任意の制約を満たす計画を生成し、ニューラルネットワークの推論時間という短い一定時間でそれらを計算する。
我々は,2つのシミュレートされたタスクと,ロボット・エアホッケーにおける打撃動作を実行するために,クカ・LBRIiwa 14ロボットアームを用いた実世界のシナリオに対して,我々のアプローチを検証した。
論文 参考訳(メタデータ) (2023-01-11T06:54:11Z) - Learning Neuro-Symbolic Skills for Bilevel Planning [63.388694268198655]
意思決定は、連続したオブジェクト中心の状態、継続的なアクション、長い地平線、まばらなフィードバックを持つロボット環境では難しい。
タスク・アンド・モーション・プランニング(TAMP)のような階層的なアプローチは、意思決定を2つ以上の抽象レベルに分解することでこれらの課題に対処する。
我々の主な貢献は、オペレーターとサンプルラーを組み合わせたパラメータ化警察の学習方法である。
論文 参考訳(メタデータ) (2022-06-21T19:01:19Z) - Transferable Task Execution from Pixels through Deep Planning Domain
Learning [46.88867228115775]
階層モデルを学ぶために,DPDL(Deep Planning Domain Learning)を提案する。
DPDLは、現在の象徴的世界状態からなる論理述語セットの値を予測する高レベルモデルを学ぶ。
これにより、ロボットが明示的に訓練されていなくても、複雑なマルチステップタスクを実行できます。
論文 参考訳(メタデータ) (2020-03-08T05:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。