Fugu-MT 論文翻訳(概要): Learning multi-robot coordination from demonstrations

論文の概要: Learning multi-robot coordination from demonstrations

arxiv url: http://arxiv.org/abs/2207.08892v1
Date: Mon, 18 Jul 2022 19:06:18 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-20 14:41:13.734052
Title: Learning multi-robot coordination from demonstrations
Title（参考訳）: デモからのマルチロボット協調学習
Authors: Xuan Wang, Wanxin Jin
Abstract要約: 我々は,ロボットの動作が,他者の行動にも依存する自身のダイナミクスと目的によって決定されるダイナミックゲームとしてマルチロボットコーディネートを表現している。提案したDDDGにより、各ロボットは、個別のダイナミクスと目的を分散的に自動調整できる。私たちは、異なるタスク構成を与えられたクオータのチームでシミュレーションでDDDGをテストします。
参考スコア（独自算出の注目度）: 5.023624620442503
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper develops a Distributed Differentiable Dynamic Game (DDDG) framework, which enables learning multi-robot coordination from demonstrations. We represent multi-robot coordination as a dynamic game, where the behavior of a robot is dictated by its own dynamics and objective that also depends on others' behavior. The coordination thus can be adapted by tuning the objective and dynamics of each robot. The proposed DDDG enables each robot to automatically tune its individual dynamics and objectives in a distributed manner by minimizing the mismatch between its trajectory and demonstrations. This process requires a new distributed design of the forward-pass, where all robots collaboratively seek Nash equilibrium behavior, and a backward-pass, where gradients are propagated via the communication graph. We test the DDDG in simulation with a team of quadrotors given different task configurations. The results demonstrate the capability of DDDG for learning multi-robot coordination from demonstrations
Abstract（参考訳）: 本稿では、デモからマルチロボット協調学習を可能にする分散微分可能動的ゲーム(DDDG)フレームワークを開発する。我々は,マルチロボット協調をダイナミックゲームとして表現し,ロボットの動作は,他者の行動にも依存する自身のダイナミクスと目的によって決定される。このように協調は、各ロボットの目的とダイナミクスをチューニングすることで適応することができる。提案したDDDGにより、各ロボットは、その軌道とデモンストレーションのミスマッチを最小限に抑えて、個々のダイナミクスと目的を自動的に分散的に調整することができる。このプロセスでは、すべてのロボットが協力してナッシュ平衡挙動を求めるフォワードパスの新しい分散設計と、勾配が通信グラフを介して伝播する後方パスが必要となる。我々は、異なるタスク構成のクワッドロータのチームでdddgをシミュレーションでテストする。実演から多ボット協調学習におけるDDDGの有用性を実証した。

関連論文リスト

RoboTAG: End-to-end Robot Configuration Estimation via Topological Alignment Graph [62.270763554624615]
単眼のRGB画像からロボットのポーズを推定することは、ロボット工学とコンピュータビジョンにおける課題である。既存の手法は通常、2Dビジュアルバックボーン上にネットワークを構築し、トレーニングのためにラベル付きデータに大きく依存する。ロボットトポロジカルアライメントグラフ(RoboTAG)を提案する。このグラフは3次元分岐を組み込んで3次元前処理を注入し、2次元および3次元表現の共進化を可能にする。
論文参考訳（メタデータ） (2025-11-11T00:49:15Z)
Action Flow Matching for Continual Robot Learning [57.698553219660376]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文参考訳（メタデータ） (2025-04-25T16:26:15Z)
Capability-Aware Shared Hypernetworks for Flexible Heterogeneous Multi-Robot Coordination [2.681242476043447]
本稿では,単一アーキテクチャが各ロボットと現在の状況に動的に適応できるように,能力認識型共有ハイパーネットワークス(CASH)を提案する。 CASHは、ローカルな観察とロボットの個人的および集団的能力に基づいて、各ロボットに適応可能な共有意思決定戦略を符号化する。
論文参考訳（メタデータ） (2025-01-10T15:39:39Z)
Robot See Robot Do: Imitating Articulated Object Manipulation with Monocular 4D Reconstruction [51.49400490437258]
本研究は,1つの単分子RGB人間の実演から音声による物体操作を模倣する手法を開発した。まず,モノクロ映像から3次元部分運動を復元する4次元微分可能部品モデル(4D-DPM)を提案する。この4D再構成を前提として、ロボットは物体の軌道を再現し、両腕の動きを計画し、実証された物体部分の動きを誘導する。両用するYuMiロボットを用いて,4D-DPMの3D追跡精度を実写3D部分軌跡に基づいて評価し,9つのオブジェクトに対してRSRDの物理的実行性能を評価した。
論文参考訳（メタデータ） (2024-09-26T17:57:16Z)
Hierarchical Procedural Framework for Low-latency Robot-Assisted Hand-Object Interaction [45.256762954338704]
ロボット支援ハンドオブジェクトインタラクション(HOI)を実現するための階層型手続きフレームワークを提案する。オープンループ階層は、手の動きをロボットの動きに変換するように設計されたモーションプリミティブに基づいて、RGBベースの人間の手の3D再構成を利用する。リングウェアリングタスクのケーススタディは、医療や製造業などの補助技術への本研究の適用の可能性を示している。
論文参考訳（メタデータ） (2024-05-29T21:20:16Z)
Interactive Multi-Robot Flocking with Gesture Responsiveness and Musical Accompaniment [0.7659052547635159]
この研究は魅力的なマルチロボットタスクを示し、その主な目的は熱意と関心を喚起することである。このタスクでは、人間と一緒に動き、ダイナミックで表現力のあるロボット群に参加することが目標である。この目的に向けて、研究チームはロボットの動きとジェスチャーや音といった対話モードを関連づけるアルゴリズムを開発した。
論文参考訳（メタデータ） (2024-03-30T18:16:28Z)
Nonprehensile Planar Manipulation through Reinforcement Learning with Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。分類分布を用いたマルチモーダル探索手法を提案する。学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文参考訳（メタデータ） (2023-08-04T16:55:00Z)
DMFC-GraspNet: Differentiable Multi-Fingered Robotic Grasp Generation in Cluttered Scenes [22.835683657191936]
マルチフィンガーロボットグリップは、複雑なオブジェクト操作を行う可能性がある。マルチフィンガーロボットグリップの現在の技術は、推論時間毎に1つのグリップしか予測しないことが多い。本稿では,この課題に対処するための3つの主要なコントリビューションを持つ,微分可能なマルチフィンガーグリップ生成ネットワーク(DMFC-GraspNet)を提案する。
論文参考訳（メタデータ） (2023-08-01T11:21:07Z)
Human-Robot Skill Transfer with Enhanced Compliance via Dynamic Movement Primitives [1.7901837062462316]
本研究では,動的運動プリミティブ(Dynamic Movement Primitives)フレームワークにおいて,人間の実演から動的特徴を抽出し,パラメータを自動チューニングする体系的手法を提案する。本手法は,LfDとRLの両方に追従するロボット軌道を再現するために,人間の動的特徴を抽出するための実際のロボット装置に実装した。
論文参考訳（メタデータ） (2023-04-12T08:48:28Z)
Simultaneous Contact-Rich Grasping and Locomotion via Distributed Optimization Enabling Free-Climbing for Multi-Limbed Robots [60.06216976204385]
移動, 把握, 接触問題を同時に解くための効率的な運動計画フレームワークを提案する。ハードウェア実験において提案手法を実証し, より短い計画時間で, 傾斜角45degで自由クライミングを含む様々な動作を実現できることを示す。
論文参考訳（メタデータ） (2022-07-04T13:52:10Z)
Intelligent Trajectory Design for RIS-NOMA aided Multi-robot Communications [59.34642007625687]
目的は,ロボットの軌道とNOMA復号命令を協調的に最適化することで,マルチロボットシステムにおける全軌道の総和率を最大化することである。 ARIMAモデルとDouble Deep Q-network (D$3$QN)アルゴリズムを組み合わせたML方式を提案する。
論文参考訳（メタデータ） (2022-05-03T17:14:47Z)
REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文参考訳（メタデータ） (2022-02-10T18:50:25Z)
Malleable Agents for Re-Configurable Robotic Manipulators [0.0]
本稿では,深部ニューラルネットワークにシーケンスニューラルネットワークを組み込んだRLエージェントを提案する。ドメインランダム化の新たなツールにより、このエージェントはリンクの数/長さやダイナミックスノイズの異なる構成に適応する。
論文参考訳（メタデータ） (2022-02-04T21:22:00Z)
Large Scale Distributed Collaborative Unlabeled Motion Planning with Graph Policy Gradients [122.85280150421175]
本研究では,運動制約と空間制約を多数のロボットに対して2次元空間で解くための学習法を提案する。ロボットのポリシーをパラメータ化するためにグラフニューラルネットワーク(GNN)を用いる。
論文参考訳（メタデータ） (2021-02-11T21:57:43Z)
Learning Cross-Domain Correspondence for Control with Dynamics Cycle-Consistency [60.39133304370604]
サイクル一貫性制約を用いて2つのドメインで動的ロボットの挙動を調整することを学ぶ。本フレームワークは,実ロボットアームの無補間単眼映像とシミュレーションアームの動的状態動作軌跡をペアデータなしで一致させることができる。
論文参考訳（メタデータ） (2020-12-17T18:22:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。