論文の概要: CLAS: Coordinating Multi-Robot Manipulation with Central Latent Action
Spaces
- arxiv url: http://arxiv.org/abs/2211.15824v1
- Date: Mon, 28 Nov 2022 23:20:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 15:01:59.790520
- Title: CLAS: Coordinating Multi-Robot Manipulation with Central Latent Action
Spaces
- Title(参考訳): clas: 中央潜在アクションスペースによるマルチロボット操作のコーディネート
- Authors: Elie Aljalbout and Maximilian Karl and Patrick van der Smagt
- Abstract要約: 本稿では,異なるエージェント間で共有される学習された潜在行動空間を通じて,マルチロボット操作を協調する手法を提案する。
シミュレーションされたマルチロボット操作タスクにおいて本手法を検証し,サンプル効率と学習性能の観点から,従来のベースラインよりも改善したことを示す。
- 参考スコア(独自算出の注目度): 9.578169216444813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-robot manipulation tasks involve various control entities that can be
separated into dynamically independent parts. A typical example of such
real-world tasks is dual-arm manipulation. Learning to naively solve such tasks
with reinforcement learning is often unfeasible due to the sample complexity
and exploration requirements growing with the dimensionality of the action and
state spaces. Instead, we would like to handle such environments as multi-agent
systems and have several agents control parts of the whole. However,
decentralizing the generation of actions requires coordination across agents
through a channel limited to information central to the task. This paper
proposes an approach to coordinating multi-robot manipulation through learned
latent action spaces that are shared across different agents. We validate our
method in simulated multi-robot manipulation tasks and demonstrate improvement
over previous baselines in terms of sample efficiency and learning performance.
- Abstract(参考訳): マルチロボット操作タスクは、動的に独立した部分に分割することができる様々な制御エンティティを含む。
そのような現実世界のタスクの典型的な例はデュアルアーム操作である。
このようなタスクを強化学習でナビゲート的に解くことは、アクションと状態空間の次元とともに成長するサンプルの複雑さと探索要求のため、しばしば実現不可能である。
代わりに、マルチエージェントシステムのような環境を扱い、エージェントが全体を制御するようにしたいと考えています。
しかし、アクションの生成を分散化するには、タスクの中心となる情報に制限されたチャネルを通じてエージェント間の調整が必要である。
本稿では,異なるエージェント間で共有される学習された潜在行動空間を通じて,マルチロボット操作を協調する手法を提案する。
シミュレーションによるマルチロボット操作タスクにおいて,本手法を検証し,サンプル効率と学習性能の観点から,従来のベースラインよりも改善することを示す。
関連論文リスト
- Variational Offline Multi-agent Skill Discovery [43.869625428099425]
本稿では,サブグループレベルの抽象化と時間レベルの抽象化を同時に取得し,マルチエージェントスキルを形成するための2つの新しい自動エンコーダ方式を提案する。
提案手法はオフラインのマルチタスクデータに適用可能であり,検出したサブグループスキルは再トレーニングすることなく,関連するタスク間で伝達可能である。
論文 参考訳(メタデータ) (2024-05-26T00:24:46Z) - Learning Manipulation Tasks in Dynamic and Shared 3D Spaces [2.4892784882130132]
自動ピック・アンド・プレイス操作の学習は、協調的な自律システムを導入することで効率的に行うことができる。
本稿では,多カテゴリー項目の配置課題を学習するための深層強化学習戦略を提案する。
論文 参考訳(メタデータ) (2024-04-26T19:40:19Z) - RObotic MAnipulation Network (ROMAN) $\unicode{x2013}$ Hybrid
Hierarchical Learning for Solving Complex Sequential Tasks [70.69063219750952]
ロボットマニピュレーションネットワーク(ROMAN)のハイブリッド階層型学習フレームワークを提案する。
ROMANは、行動クローニング、模倣学習、強化学習を統合することで、タスクの汎用性と堅牢な障害回復を実現する。
実験結果から,これらの専門的な操作専門家の組織化と活性化により,ROMANは高度な操作タスクの長いシーケンスを達成するための適切なシーケンシャルなアクティベーションを生成することがわかった。
論文 参考訳(メタデータ) (2023-06-30T20:35:22Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - LDSA: Learning Dynamic Subtask Assignment in Cooperative Multi-Agent
Reinforcement Learning [122.47938710284784]
協調型MARLにおける動的サブタスク代入(LDSA)を学習するための新しいフレームワークを提案する。
エージェントを異なるサブタスクに合理的に割り当てるために,能力に基づくサブタスク選択戦略を提案する。
LDSAは、より優れたコラボレーションのために、合理的で効果的なサブタスクの割り当てを学習していることを示す。
論文 参考訳(メタデータ) (2022-05-05T10:46:16Z) - Learning Multi-Arm Manipulation Through Collaborative Teleoperation [63.35924708783826]
模倣学習(il)はロボットに操作タスクを実行するための強力なパラダイムである。
多くの現実世界のタスクは、重い物体を持ち上げる、デスクを組み立てるなど、複数のアームを必要とする。
複数のリモートユーザが同時にロボットアームを遠隔操作できるマルチユーザデータ収集プラットフォームであるMulti-Arm RoboTurk(MART)を紹介した。
論文 参考訳(メタデータ) (2020-12-12T05:43:43Z) - Human-in-the-Loop Imitation Learning using Remote Teleoperation [72.2847988686463]
6-DoF操作設定に合わせたデータ収集システムを構築します。
システムによって収集された新しいデータに基づいて,ポリシーを反復的にトレーニングするアルゴリズムを開発した。
介入型システムで収集したデータに基づいて訓練されたエージェントと、非介入型デモ参加者が収集した同等数のサンプルで訓練されたアルゴリズムを上回るエージェントを実証する。
論文 参考訳(メタデータ) (2020-12-12T05:30:35Z) - Learning to Compose Hierarchical Object-Centric Controllers for Robotic
Manipulation [26.24940293693809]
本稿では、強化学習を用いて、操作タスクのための階層型オブジェクト中心コントローラを構築することを提案する。
シミュレーションと実世界の双方での実験では、提案手法がサンプル効率の向上、ゼロショットの一般化、微調整なしでのシミュレーションと現実の移動にどのように寄与するかが示されている。
論文 参考訳(メタデータ) (2020-11-09T18:38:29Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。