論文の概要: Enabling Multi-Robot Collaboration from Single-Human Guidance
- arxiv url: http://arxiv.org/abs/2409.19831v1
- Date: Mon, 30 Sep 2024 00:02:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-01 21:57:47.005061
- Title: Enabling Multi-Robot Collaboration from Single-Human Guidance
- Title(参考訳): シングルヒューマン誘導による複数ロボット協調の実現
- Authors: Zhengran Ji, Lingyu Zhang, Paul Sajda, Boyuan Chen,
- Abstract要約: 本研究では,人間一人の専門知識を活用することで,マルチエージェントシステムにおける協調行動の効率的な学習方法を提案する。
本研究では,人間の操作者が短時間に制御エージェントを動的に切り替えることによって,効果的に協調学習ができることを示す。
実験の結果,本手法は,人的指導を40分で最大58$%向上させることができた。
- 参考スコア(独自算出の注目度): 5.016558275355615
- License:
- Abstract: Learning collaborative behaviors is essential for multi-agent systems. Traditionally, multi-agent reinforcement learning solves this implicitly through a joint reward and centralized observations, assuming collaborative behavior will emerge. Other studies propose to learn from demonstrations of a group of collaborative experts. Instead, we propose an efficient and explicit way of learning collaborative behaviors in multi-agent systems by leveraging expertise from only a single human. Our insight is that humans can naturally take on various roles in a team. We show that agents can effectively learn to collaborate by allowing a human operator to dynamically switch between controlling agents for a short period and incorporating a human-like theory-of-mind model of teammates. Our experiments showed that our method improves the success rate of a challenging collaborative hide-and-seek task by up to 58$% with only 40 minutes of human guidance. We further demonstrate our findings transfer to the real world by conducting multi-robot experiments.
- Abstract(参考訳): 協調行動の学習はマルチエージェントシステムにとって不可欠である。
伝統的に、マルチエージェント強化学習は共同報酬と集中的な観察を通して暗黙的にこれを解決し、協調行動が現れると仮定する。
他の研究では、協力的な専門家のグループによるデモンストレーションから学ぶことを提案する。
そこで我々は,一人の人間のみの専門知識を活用することで,多エージェントシステムにおける協調行動の効率的かつ明示的な学習方法を提案する。
私たちの洞察では、人間はチームの中で様々な役割を担えます。
本研究では,人間操作者が短時間で制御エージェントを動的に切り替えることができ,チームメイトの人間的な理論を取り入れることで,効果的に協調学習できることを示す。
実験の結果,本手法は,人的指導を40分で最大58$%向上させることができた。
さらに,本研究は,マルチロボット実験により実世界への移動を実証する。
関連論文リスト
- COMBO: Compositional World Models for Embodied Multi-Agent Cooperation [64.27636858152522]
分散エージェントは、世界の部分的な自我中心的な見解にのみ、協力しなくてはならない。
我々は、部分的な自我中心の観測から世界全体の状態を推定するために生成モデルを訓練する。
複数のエージェントの自然な構成可能な共同動作を分解することにより、マルチエージェント協調のための構成的世界モデルを学ぶ。
論文 参考訳(メタデータ) (2024-04-16T17:59:11Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - Online Learning of Human Constraints from Feedback in Shared Autonomy [25.173950581816086]
人間とのリアルタイムなコラボレーションは、様々な物理的制約によって生じる人間の行動パターンが異なるため、課題を提起する。
我々は、異なる人間のオペレータの多様な振る舞いを考慮した人間の制約モデルを学ぶ。
本研究では,人間の身体的制約を学習し,適応できる補助エージェントを提案する。
論文 参考訳(メタデータ) (2024-03-05T13:53:48Z) - AgentVerse: Facilitating Multi-Agent Collaboration and Exploring
Emergent Behaviors [93.38830440346783]
本稿では,その構成をより高機能なシステムとして協調的に調整できるマルチエージェントフレームワークを提案する。
実験により,フレームワークが単一エージェントより優れたマルチエージェントグループを効果的に展開できることが実証された。
これらの振舞いの観点から、我々は、ポジティブなものを活用し、ネガティブなものを緩和し、マルチエージェントグループの協調可能性を改善するためのいくつかの戦略について議論する。
論文 参考訳(メタデータ) (2023-08-21T16:47:11Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - CH-MARL: A Multimodal Benchmark for Cooperative, Heterogeneous
Multi-Agent Reinforcement Learning [15.686200550604815]
マルチルームホーム環境において,複数の模擬異種ロボット間の協調作業を含むタスクを含むベンチマークデータセットを提案する。
我々は、統合学習フレームワーク、最先端マルチエージェント強化学習技術のマルチモーダル実装、一貫した評価プロトコルを提供する。
論文 参考訳(メタデータ) (2022-08-26T02:21:31Z) - Co-GAIL: Learning Diverse Strategies for Human-Robot Collaboration [51.268988527778276]
本研究では,人間とロボットの協調実験から人間とロボットの協調政策を学習する手法を提案する。
本手法は対話型学習プロセスにおけるヒューマンポリシーとロボットポリシーを協調的に最適化する。
論文 参考訳(メタデータ) (2021-08-13T03:14:43Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Getting to Know One Another: Calibrating Intent, Capabilities and Trust
for Human-Robot Collaboration [13.895990928770459]
ロボットが直接意思を伝えることができない人間を支援するシナリオに焦点を当てる。
我々は、決定論的アプローチを採用し、この設定をモデル化するためのTICC-POMDPを提案する。
実験によって、我々のアプローチはシミュレーションと実際の被験者による研究の両方において、より良いチームパフォーマンスをもたらすことが示された。
論文 参考訳(メタデータ) (2020-08-03T08:04:15Z) - Human and Multi-Agent collaboration in a human-MARL teaming framework [0.0]
強化学習は、観察、報酬の受け取り、エージェント間の内部相互作用から学ぶエージェントの効果的な結果を提供する。
本研究では,学習の源泉として人間とエージェントの相互作用を効率的に活用するオープンソースMARLフレームワークであるCOGMENTを提案する。
論文 参考訳(メタデータ) (2020-06-12T16:32:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。