論文の概要: Robot Action Selection Learning via Layered Dimension Informed Program
Synthesis
- arxiv url: http://arxiv.org/abs/2008.04133v2
- Date: Thu, 12 Nov 2020 20:17:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 23:32:36.786128
- Title: Robot Action Selection Learning via Layered Dimension Informed Program
Synthesis
- Title(参考訳): 階層次元インフォームド・プログラム合成によるロボット行動選択学習
- Authors: Jarrett Holtz, Arjun Guha, Joydeep Biswas
- Abstract要約: アクション選択ポリシー(ASPs)は、複雑なハイレベルなタスクに低レベルのロボットスキルを構成するために使用される。
ロボット工学におけるASPsに関する2つの重要な洞察を提示する。
層状次元インフォームドプログラム合成(LDIPS)を導入する。
- 参考スコア(独自算出の注目度): 12.568929994661769
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Action selection policies (ASPs), used to compose low-level robot skills into
complex high-level tasks are commonly represented as neural networks (NNs) in
the state of the art. Such a paradigm, while very effective, suffers from a few
key problems: 1) NNs are opaque to the user and hence not amenable to
verification, 2) they require significant amounts of training data, and 3) they
are hard to repair when the domain changes. We present two key insights about
ASPs for robotics. First, ASPs need to reason about physically meaningful
quantities derived from the state of the world, and second, there exists a
layered structure for composing these policies. Leveraging these insights, we
introduce layered dimension-informed program synthesis (LDIPS) - by reasoning
about the physical dimensions of state variables, and dimensional constraints
on operators, LDIPS directly synthesizes ASPs in a human-interpretable
domain-specific language that is amenable to program repair. We present
empirical results to demonstrate that LDIPS 1) can synthesize effective ASPs
for robot soccer and autonomous driving domains, 2) requires two orders of
magnitude fewer training examples than a comparable NN representation, and 3)
can repair the synthesized ASPs with only a small number of corrections when
transferring from simulation to real robots.
- Abstract(参考訳): 低レベルのロボットスキルを複雑な高レベルのタスクに構成するために使用されるアクション選択ポリシー(ASPs)は、技術の現状においてニューラルネットワーク(NNs)として一般的に表現される。
このようなパラダイムは非常に効果的だが、いくつかの重要な問題に悩まされている。
1) NNはユーザにとって不透明であるため、検証には適さない。
2) かなりの量の訓練データが必要であり、
3) ドメインが変更されると修復が困難になる。
我々はロボット工学のaspに関する2つの重要な洞察を提示する。
まず、ASPは世界の状態から引き出された物理的に意味のある量について考える必要があり、次に、これらのポリシーを構成するための階層構造が存在する。
これらの知見を生かして、状態変数の物理的次元と演算子の次元制約を推論することにより、LDIPSは、プログラムの修正が可能な、人間の解釈可能なドメイン固有言語でASPを直接合成する。
LDIPSの実証実験結果を示す。
1)ロボットサッカーと自律運転ドメインのための効果的なaspを合成できる。
2) 同等のNN表現よりも2桁少ないトレーニング例を必要とする。
3) シミュレーションから実際のロボットへ転送する際, 少数の補正で合成されたaspを修復することができる。
関連論文リスト
- $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - Grounding Robot Policies with Visuomotor Language Guidance [15.774237279917594]
ロボットポリシーを現在の状況に基盤付けるためのエージェントベースのフレームワークを提案する。
提案するフレームワークは、特定の役割のために設計された会話エージェントのセットで構成されている。
弊社のアプローチは、操作ポリシーを効果的にガイドし、成功率を大幅に向上させることを実証する。
論文 参考訳(メタデータ) (2024-10-09T02:00:37Z) - Robotic Control via Embodied Chain-of-Thought Reasoning [86.6680905262442]
学習したロボット制御ポリシーの鍵となる制限は、トレーニングデータの外部で一般化できないことである。
視覚言語行動モデル(VLA)に関する最近の研究は、大規模なインターネット事前学習型視覚言語モデルを使用することで、その堅牢性と一般化能力を大幅に向上させることができることを示した。
ロボットの動作を予測する前に、VLAに対して、計画、サブタスク、動作、視覚的接地機能について複数の推論を行うために、VLAに対してEmbodied Chain-of-Thought Reasoning (ECoT)を導入する。
論文 参考訳(メタデータ) (2024-07-11T17:31:01Z) - Imperative Learning: A Self-supervised Neural-Symbolic Learning Framework for Robot Autonomy [31.818923556912495]
我々は,ロボット自律のための自己教師型ニューラルシンボリック(NeSy)計算フレームワーク,インペラティブラーニング(IL)を導入する。
ILを2段階最適化(BLO)として定式化し、3つのモジュール間の相互学習を可能にする。
ILはロボットの自律性を大幅に向上させ、多様な領域にわたるさらなる研究を促進することを期待している。
論文 参考訳(メタデータ) (2024-06-23T12:02:17Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications
to Coverage Control [80.86089324742024]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic
Control [140.48218261864153]
本研究では,インターネット規模のデータに基づいて学習した視覚言語モデルを,エンドツーエンドのロボット制御に直接組み込む方法について検討する。
提案手法は,インターネット規模のトレーニングから,RT-2による創発的能力の獲得を可能にした。
論文 参考訳(メタデータ) (2023-07-28T21:18:02Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Grounding Language with Visual Affordances over Unstructured Data [26.92329260907805]
本研究では,非構造化,オフライン,リセットのないデータから,言語条件のロボットスキルを効率的に学習するための新しい手法を提案する。
我々は、言語による全データの1%しか必要としない自己教師型ビジュオ言語割当モデルを利用する。
提案手法は,従来の手法よりも桁違いに少ないデータで,リアルタイムに長時間の多層タスクを完了できることがわかった。
論文 参考訳(メタデータ) (2022-10-04T21:16:48Z) - Towards Plug'n Play Task-Level Autonomy for Robotics Using POMDPs and
Generative Models [0.0]
ロボットのスキルを、特定のタスクを達成するためにそのスキルをスケジュールする作業自律型ロボットコントローラに統合するアプローチについて述べる。
私たちのジェネレーティブスキルドキュメンテーション言語(GSDL)は、コードドキュメンテーションをコンパクトで表現力のあるものにします。
抽象マッピング(AM)は、低レベルのロボットコードと抽象AI計画モデルとのギャップを埋める。
論文 参考訳(メタデータ) (2022-07-20T07:27:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。