論文の概要: Towards Plug'n Play Task-Level Autonomy for Robotics Using POMDPs and
Generative Models
- arxiv url: http://arxiv.org/abs/2207.09713v1
- Date: Wed, 20 Jul 2022 07:27:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-21 14:14:34.239360
- Title: Towards Plug'n Play Task-Level Autonomy for Robotics Using POMDPs and
Generative Models
- Title(参考訳): POMDPと生成モデルを用いたロボットのためのプラグプレイタスクレベルオートノミーを目指して
- Authors: Or Wertheim (Ben-Gurion University of the Negev), Dan R. Suissa
(Ben-Gurion University of the Negev), Ronen I. Brafman (Ben-Gurion University
of the Negev)
- Abstract要約: ロボットのスキルを、特定のタスクを達成するためにそのスキルをスケジュールする作業自律型ロボットコントローラに統合するアプローチについて述べる。
私たちのジェネレーティブスキルドキュメンテーション言語(GSDL)は、コードドキュメンテーションをコンパクトで表現力のあるものにします。
抽象マッピング(AM)は、低レベルのロボットコードと抽象AI計画モデルとのギャップを埋める。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To enable robots to achieve high level objectives, engineers typically write
scripts that apply existing specialized skills, such as navigation, object
detection and manipulation to achieve these goals. Writing good scripts is
challenging since they must intelligently balance the inherent stochasticity of
a physical robot's actions and sensors, and the limited information it has. In
principle, AI planning can be used to address this challenge and generate good
behavior policies automatically. But this requires passing three hurdles.
First, the AI must understand each skill's impact on the world. Second, we must
bridge the gap between the more abstract level at which we understand what a
skill does and the low-level state variables used within its code. Third, much
integration effort is required to tie together all components. We describe an
approach for integrating robot skills into a working autonomous robot
controller that schedules its skills to achieve a specified task and carries
four key advantages. 1) Our Generative Skill Documentation Language (GSDL)
makes code documentation simpler, compact, and more expressive using ideas from
probabilistic programming languages. 2) An expressive abstraction mapping (AM)
bridges the gap between low-level robot code and the abstract AI planning
model. 3) Any properly documented skill can be used by the controller without
any additional programming effort, providing a Plug'n Play experience. 4) A
POMDP solver schedules skill execution while properly balancing partial
observability, stochastic behavior, and noisy sensing.
- Abstract(参考訳): ロボットが高い目標を達成するために、エンジニアは通常、これらの目標を達成するためにナビゲーション、オブジェクト検出、操作といった既存の特殊なスキルを適用するスクリプトを書く。
物理的なロボットの動作やセンサーの固有の確率性と、それが持っている限られた情報とをインテリジェントにバランスさせる必要があるため、優れたスクリプトを書くことは難しい。
原則として、AI計画はこの課題に対処し、優れた行動ポリシーを自動生成するために使用することができる。
しかし、これは3つのハードルを乗り越える必要がある。
まず、AIはそれぞれのスキルが世界に与える影響を理解する必要がある。
第2に、スキルとコード内で使用される低レベルの状態変数を理解するための、より抽象的なレベルのギャップを埋める必要があります。
第三に、すべてのコンポーネントを結びつけるには、多くの統合作業が必要です。
ロボットのスキルを、特定のタスクを達成するためにそのスキルをスケジュールし、4つの重要な利点をもたらす作業自律型ロボットコントローラに統合するアプローチについて述べる。
1) 我々のジェネレーティブスキル文書言語(gsdl)は、確率的プログラミング言語のアイデアを使って、コードドキュメントをシンプルで、コンパクトで、より表現豊かにします。
2)表現的抽象マッピング(AM)は,低レベルロボットコードと抽象AI計画モデルとのギャップを埋める。
3) 適切に文書化されたスキルは、追加のプログラミング作業なしにコントローラによって使用することができ、プラグンプレイ体験を提供する。
4)POMDPソルバは,部分観測可能性,確率的挙動,ノイズ感知を適切にバランスしながら,スキル実行をスケジュールする。
関連論文リスト
- $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - Robotic Control via Embodied Chain-of-Thought Reasoning [86.6680905262442]
学習したロボット制御ポリシーの鍵となる制限は、トレーニングデータの外部で一般化できないことである。
視覚言語行動モデル(VLA)に関する最近の研究は、大規模なインターネット事前学習型視覚言語モデルを使用することで、その堅牢性と一般化能力を大幅に向上させることができることを示した。
ロボットの動作を予測する前に、VLAに対して、計画、サブタスク、動作、視覚的接地機能について複数の推論を行うために、VLAに対してEmbodied Chain-of-Thought Reasoning (ECoT)を導入する。
論文 参考訳(メタデータ) (2024-07-11T17:31:01Z) - Plan-Seq-Learn: Language Model Guided RL for Solving Long Horizon Robotics Tasks [50.27313829438866]
Plan-Seq-Learn (PSL) は、抽象言語と学習した低レベル制御の間のギャップを埋めるためにモーションプランニングを使用するモジュラーアプローチである。
PSLは85%以上の成功率、言語ベース、古典的、エンドツーエンドのアプローチを達成している。
論文 参考訳(メタデータ) (2024-05-02T17:59:31Z) - RoboCodeX: Multimodal Code Generation for Robotic Behavior Synthesis [102.1876259853457]
汎用ロボット行動合成のための木構造多モードコード生成フレームワークRoboCodeXを提案する。
RoboCodeXは、高レベルの人間の命令を複数のオブジェクト中心の操作ユニットに分解する。
概念的および知覚的理解を制御コマンドにマッピングする能力をさらに強化するため、事前学習のための特別なマルチモーダル推論データセットを収集し、教師付き微調整のための反復的自己更新手法を導入する。
論文 参考訳(メタデータ) (2024-02-25T15:31:43Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Using Knowledge Representation and Task Planning for Robot-agnostic
Skills on the Example of Contact-Rich Wiping Tasks [44.99833362998488]
本研究では,知識表現,タスク計画,スキル実装の自動選択を利用した単一のロボットスキルを,異なるコンテキストで実行可能であることを示す。
このスキルベースの制御プラットフォームが、異なるロボットシステム上でのコンタクトリッチなワイピングタスクでこれをどのように実現できるかを実証する。
論文 参考訳(メタデータ) (2023-08-27T21:17:32Z) - Can Foundation Models Perform Zero-Shot Task Specification For Robot
Manipulation? [54.442692221567796]
タスク仕様は、熟練していないエンドユーザの関与とパーソナライズされたロボットの採用に不可欠である。
タスク仕様に対する広く研究されているアプローチは、目標を通じて、コンパクトな状態ベクトルまたは同じロボットシーンのゴールイメージを使用することである。
そこで本研究では,人間の指定や使用が容易な目標仕様の代替的,より汎用的な形式について検討する。
論文 参考訳(メタデータ) (2022-04-23T19:39:49Z) - Learning and Sequencing of Object-Centric Manipulation Skills for
Industrial Tasks [16.308562047398542]
本稿では,オブジェクト中心の隠れセミマルコフモデルを用いて,ロボットのスキルシーケンスを高速に符号化するアルゴリズムを提案する。
学習したスキルモデルは、多モーダルな(時間的および空間的な)軌道分布を符号化することができる。
本研究では,産業用組立作業用ロボットアーム7台について実演する。
論文 参考訳(メタデータ) (2020-08-24T14:20:05Z) - Enabling human-like task identification from natural conversation [7.00597813134145]
我々は,NLPエンジンとプランナを組み合わせた非自明な手法を提案し,ロボットがタスクと関連するパラメータをすべて識別し,タスクの正確な計画を生成する。
この研究は、ロボットにおける人間のようなタスク理解能力の実現に向けて、大きな一歩を踏み出した。
論文 参考訳(メタデータ) (2020-08-23T17:19:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。