論文の概要: MASH: Cooperative-Heterogeneous Multi-Agent Reinforcement Learning for Single Humanoid Robot Locomotion
- arxiv url: http://arxiv.org/abs/2508.10423v1
- Date: Thu, 14 Aug 2025 07:54:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.218915
- Title: MASH: Cooperative-Heterogeneous Multi-Agent Reinforcement Learning for Single Humanoid Robot Locomotion
- Title(参考訳): MASH:シングルヒューマノイドロボットロコモーションのための協調的・異種多エージェント強化学習
- Authors: Qi Liu, Xiaopeng Zhang, Mingshan Tan, Shuaikang Ma, Jinliang Ding, Yanjie Li,
- Abstract要約: 本稿では, 協調型多エージェント深部強化学習(MARL)による単一ヒューマノイドロボットの移動促進手法を提案する。
実験により,MASHは訓練の収束を加速し,全身協調能力を向上させることが示され,従来の単エージェント強化学習法よりも優れていた。
この研究は、MARLをシングルヒューマノイドロボット制御に統合し、効率的な移動戦略に関する新たな洞察を提供する。
- 参考スコア(独自算出の注目度): 14.728331588105789
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a novel method to enhance locomotion for a single humanoid robot through cooperative-heterogeneous multi-agent deep reinforcement learning (MARL). While most existing methods typically employ single-agent reinforcement learning algorithms for a single humanoid robot or MARL algorithms for multi-robot system tasks, we propose a distinct paradigm: applying cooperative-heterogeneous MARL to optimize locomotion for a single humanoid robot. The proposed method, multi-agent reinforcement learning for single humanoid locomotion (MASH), treats each limb (legs and arms) as an independent agent that explores the robot's action space while sharing a global critic for cooperative learning. Experiments demonstrate that MASH accelerates training convergence and improves whole-body cooperation ability, outperforming conventional single-agent reinforcement learning methods. This work advances the integration of MARL into single-humanoid-robot control, offering new insights into efficient locomotion strategies.
- Abstract(参考訳): 本稿では, 協調的・異種多エージェント深部強化学習(MARL)による単一ヒューマノイドロボットの移動促進手法を提案する。
既存のほとんどの手法では、単一ヒューマノイドロボットやマルチロボットシステムタスクにMARLアルゴリズムに単一エージェント強化学習アルゴリズムを用いるのが一般的であるが、協調異種MARLを適用して単一ヒューマノイドロボットの移動を最適化するパラダイムが提案されている。
一つのヒューマノイド移動(MASH)のためのマルチエージェント強化学習(Multi-agent reinforcement learning)は,ロボットの行動空間を探索する独立したエージェントとして各手足(手足と腕)を扱い,協調学習に対するグローバルな批判を共有した。
実験により,MASHは訓練の収束を加速し,全身協調能力を向上させることが示され,従来の単エージェント強化学習法よりも優れていた。
この研究は、MARLをシングルヒューマノイドロボット制御に統合し、効率的な移動戦略に関する新たな洞察を提供する。
関連論文リスト
- Mixed-Initiative Dialog for Human-Robot Collaborative Manipulation [8.446410154654467]
MICoBotは、両方のエージェントが自然言語を使用して、タスクの最も優れたステップを完遂できる提案を定式化、受け入れ、拒否する、という一般的なシナリオを扱う。
課題指向の対話を多様に扱うために,MICoBotは,(1)メタプランナーが人間のダイアログに高レベルの協調戦略を定式化してコーディングすることを考慮し,(2)プランナーがロボットの能力に基づいて各エージェントに残りのステップを最適に割り当てる,(3)行動が人間に言うような低レベルの行動を決定する,という3段階の意思決定を行う。
論文 参考訳(メタデータ) (2025-08-07T16:09:12Z) - HACTS: a Human-As-Copilot Teleoperation System for Robot Learning [47.9126187195398]
HACTS(Human-As-Copilot Teleoperation System)は,ロボットアームと遠隔操作ハードウェアを双方向でリアルタイムに同期させるシステムである。
このシンプルで効果的なフィードバックメカニズムは、自動運転車のステアリングホイールに似たもので、人間の操縦士がシームレスに介入し、将来の学習のために行動補正データを収集することを可能にする。
論文 参考訳(メタデータ) (2025-03-31T13:28:13Z) - Enabling Multi-Robot Collaboration from Single-Human Guidance [5.016558275355615]
本研究では,人間一人の専門知識を活用することで,マルチエージェントシステムにおける協調行動の効率的な学習方法を提案する。
本研究では,人間の操作者が短時間に制御エージェントを動的に切り替えることによって,効果的に協調学習ができることを示す。
実験の結果,本手法は,人的指導を40分で最大58%向上させることができた。
論文 参考訳(メタデータ) (2024-09-30T00:02:56Z) - Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.65867987106428]
本稿では,人間とロボットの協調学習システムについて紹介する。
これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。
これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文 参考訳(メタデータ) (2024-06-29T03:37:29Z) - Learning Multimodal Latent Dynamics for Human-Robot Interaction [18.68936554172693]
本稿では,ヒト-ヒトインタラクション(HHI)から協調型人間-ロボットインタラクション(HRI)を学習する方法を提案する。
本研究では,隠れマルコフモデル(HMM)を変分オートエンコーダの潜在空間として用いて,相互作用するエージェントの結合分布をモデル化するハイブリッドアプローチを考案する。
利用者は,我々の手法を,より人間らしく,タイムリーで,正確なものと認識し,他の基準よりも高い選好度で評価する。
論文 参考訳(メタデータ) (2023-11-27T23:56:59Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。