論文の概要: Learning multi-robot coordination from demonstrations
- arxiv url: http://arxiv.org/abs/2207.08892v1
- Date: Mon, 18 Jul 2022 19:06:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-20 14:41:13.734052
- Title: Learning multi-robot coordination from demonstrations
- Title(参考訳): デモからのマルチロボット協調学習
- Authors: Xuan Wang, Wanxin Jin
- Abstract要約: 我々は,ロボットの動作が,他者の行動にも依存する自身のダイナミクスと目的によって決定されるダイナミックゲームとしてマルチロボットコーディネートを表現している。
提案したDDDGにより、各ロボットは、個別のダイナミクスと目的を分散的に自動調整できる。
私たちは、異なるタスク構成を与えられたクオータのチームでシミュレーションでDDDGをテストします。
- 参考スコア(独自算出の注目度): 5.023624620442503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper develops a Distributed Differentiable Dynamic Game (DDDG)
framework, which enables learning multi-robot coordination from demonstrations.
We represent multi-robot coordination as a dynamic game, where the behavior of
a robot is dictated by its own dynamics and objective that also depends on
others' behavior. The coordination thus can be adapted by tuning the objective
and dynamics of each robot. The proposed DDDG enables each robot to
automatically tune its individual dynamics and objectives in a distributed
manner by minimizing the mismatch between its trajectory and demonstrations.
This process requires a new distributed design of the forward-pass, where all
robots collaboratively seek Nash equilibrium behavior, and a backward-pass,
where gradients are propagated via the communication graph. We test the DDDG in
simulation with a team of quadrotors given different task configurations. The
results demonstrate the capability of DDDG for learning multi-robot
coordination from demonstrations
- Abstract(参考訳): 本稿では、デモからマルチロボット協調学習を可能にする分散微分可能動的ゲーム(DDDG)フレームワークを開発する。
我々は,マルチロボット協調をダイナミックゲームとして表現し,ロボットの動作は,他者の行動にも依存する自身のダイナミクスと目的によって決定される。
このように協調は、各ロボットの目的とダイナミクスをチューニングすることで適応することができる。
提案したDDDGにより、各ロボットは、その軌道とデモンストレーションのミスマッチを最小限に抑えて、個々のダイナミクスと目的を自動的に分散的に調整することができる。
このプロセスでは、すべてのロボットが協力してナッシュ平衡挙動を求めるフォワードパスの新しい分散設計と、勾配が通信グラフを介して伝播する後方パスが必要となる。
我々は、異なるタスク構成のクワッドロータのチームでdddgをシミュレーションでテストする。
実演から多ボット協調学習におけるDDDGの有用性を実証した。
関連論文リスト
- Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - DMFC-GraspNet: Differentiable Multi-Fingered Robotic Grasp Generation in
Cluttered Scenes [22.835683657191936]
マルチフィンガーロボットグリップは、複雑なオブジェクト操作を行う可能性がある。
マルチフィンガーロボットグリップの現在の技術は、推論時間毎に1つのグリップしか予測しないことが多い。
本稿では,この課題に対処するための3つの主要なコントリビューションを持つ,微分可能なマルチフィンガーグリップ生成ネットワーク(DMFC-GraspNet)を提案する。
論文 参考訳(メタデータ) (2023-08-01T11:21:07Z) - Human-Robot Skill Transfer with Enhanced Compliance via Dynamic Movement
Primitives [1.7901837062462316]
本研究では,動的運動プリミティブ(Dynamic Movement Primitives)フレームワークにおいて,人間の実演から動的特徴を抽出し,パラメータを自動チューニングする体系的手法を提案する。
本手法は,LfDとRLの両方に追従するロボット軌道を再現するために,人間の動的特徴を抽出するための実際のロボット装置に実装した。
論文 参考訳(メタデータ) (2023-04-12T08:48:28Z) - Hierarchical Reinforcement Learning for Precise Soccer Shooting Skills
using a Quadrupedal Robot [76.04391023228081]
本研究では,四足歩行ロボットが実世界において,強化学習を用いて精度の高い射撃技術を実現できるという課題に対処する。
本研究では, 深層強化学習を活用して頑健な動作制御政策を訓練する階層的枠組みを提案する。
提案するフレームワークをA1四足歩行ロボットに展開し、実世界のランダムなターゲットに向けて正確にボールを発射できるようにする。
論文 参考訳(メタデータ) (2022-08-01T22:34:51Z) - Simultaneous Contact-Rich Grasping and Locomotion via Distributed
Optimization Enabling Free-Climbing for Multi-Limbed Robots [60.06216976204385]
移動, 把握, 接触問題を同時に解くための効率的な運動計画フレームワークを提案する。
ハードウェア実験において提案手法を実証し, より短い計画時間で, 傾斜角45degで自由クライミングを含む様々な動作を実現できることを示す。
論文 参考訳(メタデータ) (2022-07-04T13:52:10Z) - Intelligent Trajectory Design for RIS-NOMA aided Multi-robot
Communications [59.34642007625687]
目的は,ロボットの軌道とNOMA復号命令を協調的に最適化することで,マルチロボットシステムにおける全軌道の総和率を最大化することである。
ARIMAモデルとDouble Deep Q-network (D$3$QN)アルゴリズムを組み合わせたML方式を提案する。
論文 参考訳(メタデータ) (2022-05-03T17:14:47Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Malleable Agents for Re-Configurable Robotic Manipulators [0.0]
本稿では,深部ニューラルネットワークにシーケンスニューラルネットワークを組み込んだRLエージェントを提案する。
ドメインランダム化の新たなツールにより、このエージェントはリンクの数/長さやダイナミックスノイズの異なる構成に適応する。
論文 参考訳(メタデータ) (2022-02-04T21:22:00Z) - Multi-Person 3D Motion Prediction with Multi-Range Transformers [16.62864429495888]
本稿では,個人動作のためのローカルレンジエンコーダと,ソーシャルインタラクションのためのグローバルレンジエンコーダを含むマルチランジトランスフォーマーモデルを提案する。
我々のモデルは、長期3次元動作予測における最先端の手法に勝るだけでなく、多様な社会的相互作用も生み出す。
論文 参考訳(メタデータ) (2021-11-23T18:41:13Z) - Large Scale Distributed Collaborative Unlabeled Motion Planning with
Graph Policy Gradients [122.85280150421175]
本研究では,運動制約と空間制約を多数のロボットに対して2次元空間で解くための学習法を提案する。
ロボットのポリシーをパラメータ化するためにグラフニューラルネットワーク(GNN)を用いる。
論文 参考訳(メタデータ) (2021-02-11T21:57:43Z) - Learning Cross-Domain Correspondence for Control with Dynamics
Cycle-Consistency [60.39133304370604]
サイクル一貫性制約を用いて2つのドメインで動的ロボットの挙動を調整することを学ぶ。
本フレームワークは,実ロボットアームの無補間単眼映像とシミュレーションアームの動的状態動作軌跡をペアデータなしで一致させることができる。
論文 参考訳(メタデータ) (2020-12-17T18:22:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。