論文の概要: Robot Action Selection Learning via Layered Dimension Informed Program
Synthesis
- arxiv url: http://arxiv.org/abs/2008.04133v2
- Date: Thu, 12 Nov 2020 20:17:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 23:32:36.786128
- Title: Robot Action Selection Learning via Layered Dimension Informed Program
Synthesis
- Title(参考訳): 階層次元インフォームド・プログラム合成によるロボット行動選択学習
- Authors: Jarrett Holtz, Arjun Guha, Joydeep Biswas
- Abstract要約: アクション選択ポリシー(ASPs)は、複雑なハイレベルなタスクに低レベルのロボットスキルを構成するために使用される。
ロボット工学におけるASPsに関する2つの重要な洞察を提示する。
層状次元インフォームドプログラム合成(LDIPS)を導入する。
- 参考スコア(独自算出の注目度): 12.568929994661769
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Action selection policies (ASPs), used to compose low-level robot skills into
complex high-level tasks are commonly represented as neural networks (NNs) in
the state of the art. Such a paradigm, while very effective, suffers from a few
key problems: 1) NNs are opaque to the user and hence not amenable to
verification, 2) they require significant amounts of training data, and 3) they
are hard to repair when the domain changes. We present two key insights about
ASPs for robotics. First, ASPs need to reason about physically meaningful
quantities derived from the state of the world, and second, there exists a
layered structure for composing these policies. Leveraging these insights, we
introduce layered dimension-informed program synthesis (LDIPS) - by reasoning
about the physical dimensions of state variables, and dimensional constraints
on operators, LDIPS directly synthesizes ASPs in a human-interpretable
domain-specific language that is amenable to program repair. We present
empirical results to demonstrate that LDIPS 1) can synthesize effective ASPs
for robot soccer and autonomous driving domains, 2) requires two orders of
magnitude fewer training examples than a comparable NN representation, and 3)
can repair the synthesized ASPs with only a small number of corrections when
transferring from simulation to real robots.
- Abstract(参考訳): 低レベルのロボットスキルを複雑な高レベルのタスクに構成するために使用されるアクション選択ポリシー(ASPs)は、技術の現状においてニューラルネットワーク(NNs)として一般的に表現される。
このようなパラダイムは非常に効果的だが、いくつかの重要な問題に悩まされている。
1) NNはユーザにとって不透明であるため、検証には適さない。
2) かなりの量の訓練データが必要であり、
3) ドメインが変更されると修復が困難になる。
我々はロボット工学のaspに関する2つの重要な洞察を提示する。
まず、ASPは世界の状態から引き出された物理的に意味のある量について考える必要があり、次に、これらのポリシーを構成するための階層構造が存在する。
これらの知見を生かして、状態変数の物理的次元と演算子の次元制約を推論することにより、LDIPSは、プログラムの修正が可能な、人間の解釈可能なドメイン固有言語でASPを直接合成する。
LDIPSの実証実験結果を示す。
1)ロボットサッカーと自律運転ドメインのための効果的なaspを合成できる。
2) 同等のNN表現よりも2桁少ないトレーニング例を必要とする。
3) シミュレーションから実際のロボットへ転送する際, 少数の補正で合成されたaspを修復することができる。
関連論文リスト
- RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications
to Coverage Control [80.86089324742024]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic
Control [140.48218261864153]
本研究では,インターネット規模のデータに基づいて学習した視覚言語モデルを,エンドツーエンドのロボット制御に直接組み込む方法について検討する。
提案手法は,インターネット規模のトレーニングから,RT-2による創発的能力の獲得を可能にした。
論文 参考訳(メタデータ) (2023-07-28T21:18:02Z) - Pave the Way to Grasp Anything: Transferring Foundation Models for
Universal Pick-Place Robots [50.73735524550534]
そこで本稿では,最先端基礎モデルによって生成された言語基底セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
マスクから伝達される正確なセマンティクスとジオメトリを多視点ポリシーモデルに統合することにより、正確なオブジェクトのポーズを認識し、サンプル効率のよい学習を可能にする。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Grounding Language with Visual Affordances over Unstructured Data [26.92329260907805]
本研究では,非構造化,オフライン,リセットのないデータから,言語条件のロボットスキルを効率的に学習するための新しい手法を提案する。
我々は、言語による全データの1%しか必要としない自己教師型ビジュオ言語割当モデルを利用する。
提案手法は,従来の手法よりも桁違いに少ないデータで,リアルタイムに長時間の多層タスクを完了できることがわかった。
論文 参考訳(メタデータ) (2022-10-04T21:16:48Z) - Towards Plug'n Play Task-Level Autonomy for Robotics Using POMDPs and
Generative Models [0.0]
ロボットのスキルを、特定のタスクを達成するためにそのスキルをスケジュールする作業自律型ロボットコントローラに統合するアプローチについて述べる。
私たちのジェネレーティブスキルドキュメンテーション言語(GSDL)は、コードドキュメンテーションをコンパクトで表現力のあるものにします。
抽象マッピング(AM)は、低レベルのロボットコードと抽象AI計画モデルとのギャップを埋める。
論文 参考訳(メタデータ) (2022-07-20T07:27:47Z) - Learning of Parameters in Behavior Trees for Movement Skills [0.9562145896371784]
振舞い木(BT)は、モジュラーと構成可能なスキルをサポートするポリシー表現を提供することができる。
本稿では,BTポリシーのパラメータをシミュレーションで学習し,追加のトレーニングを伴わずに物理ロボットに一般化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-27T13:46:39Z) - Large Scale Distributed Collaborative Unlabeled Motion Planning with
Graph Policy Gradients [122.85280150421175]
本研究では,運動制約と空間制約を多数のロボットに対して2次元空間で解くための学習法を提案する。
ロボットのポリシーをパラメータ化するためにグラフニューラルネットワーク(GNN)を用いる。
論文 参考訳(メタデータ) (2021-02-11T21:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。