論文の概要: Reinforcement Learning Enabled Adaptive Multi-Task Control for Bipedal Soccer Robots
- arxiv url: http://arxiv.org/abs/2604.19104v1
- Date: Tue, 21 Apr 2026 05:27:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.636394
- Title: Reinforcement Learning Enabled Adaptive Multi-Task Control for Bipedal Soccer Robots
- Title(参考訳): 2足歩行サッカーロボットの適応型マルチタスク制御を可能にする強化学習
- Authors: Yulai Zhang, Yinrong Zhang, Ting Wu, Linqi Ye,
- Abstract要約: 本稿では,適応型マルチタスク制御を実現するためのモジュール型強化学習フレームワークを提案する。
ボールとキックネットワーク(BSKN)と転倒回復ネットワーク(FRN)とを明確に切り替えた姿勢駆動型状態機械を導入する。
- 参考スコア(独自算出の注目度): 1.6824051304328205
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing bipedal football robots in dynamiccombat environments presents challenges related to motionstability and deep coupling of multiple tasks, as well ascontrol switching issues between different states such as up-right walking and fall recovery. To address these problems,this paper proposes a modular reinforcement learning (RL)framework for achieving adaptive multi-task control. Firstly,this framework combines an open-loop feedforward oscilla-tor with a reinforcement learning-based feedback residualstrategy, effectively separating the generation of basic gaitsfrom complex football actions. Secondly, a posture-driven statemachine is introduced, clearly switching between the ballseeking and kicking network (BSKN) and the fall recoverynetwork (FRN), fundamentally preventing state interference.The FRN is efficiently trained through a progressive forceattenuation curriculum learning strategy. The architecture wasverified in Unity simulations of bipedal robots, demonstratingexcellent spatial adaptability-reliably finding and kicking theball even in restricted corner scenarios-and rapid autonomousfall recovery (with an average recovery time of 0.715 seconds).This ensures seamless and stable operation in complex multi-task environments.
- Abstract(参考訳): ダイナミックコンバット環境における二足歩行型サッカーロボットの開発は、動作安定性と複数のタスクの深いカップリングに関連する課題を提示し、右上歩行や転倒回復などの異なる状態間の切替問題を制御している。
そこで本研究では,適応型マルチタスク制御を実現するためのモジュール強化学習(RL)フレームワークを提案する。
第一に、このフレームワークは、オープンループフィードフォワードオシラ・ターと強化学習に基づくフィードバック残差戦略を組み合わせることで、複雑なサッカー行動から基本的な歩留まりの発生を効果的に分離する。
第2に、ボールシーキングとキックネットワーク(BSKN)とフォールリカバリネットワーク(FRN)とを明確に切り替えて、状態干渉を根本的に防止する姿勢駆動型状態機械を導入する。
このアーキテクチャは、二足歩行ロボットのユニティシミュレーションで検証され、制限されたコーナーシナリオや迅速な自律落下回復(平均リカバリ時間は0.715秒)においても、空間適応性が信頼性に優れ、ボールを蹴ることができた。
これにより、複雑なマルチタスク環境におけるシームレスで安定した操作が保証される。
関連論文リスト
- Tree Learning: A Multi-Skill Continual Learning Framework for Humanoid Robots [1.282675419968047]
本稿では,ヒューマノイドロボットのためのマルチスキル連続学習フレームワークであるTree Learningを提案する。
このフレームワークはルートブランチの階層的パラメータ継承機構を採用し、分岐スキルの動作先を提供する。
スキルコンバージェンスを促進するために,タスクレベルの報酬形成戦略も提案されている。
論文 参考訳(メタデータ) (2026-04-14T15:57:27Z) - CORAL: Scalable Multi-Task Robot Learning via LoRA Experts [49.759823970016974]
実世界のロボット工学におけるビジョン・ランゲージ・アクション(VLA)モデルは、コアマルチタスク学習の課題を露呈する。
タスク毎に個別の完全なチェックポイントを維持することは、しばしばストレージとデプロイメントの禁止である。
主にマルチタスク干渉を軽減するために設計されたバックボーンおよび非依存のフレームワークであるCORALを提案する。
論文 参考訳(メタデータ) (2026-03-10T07:28:41Z) - Role-Adaptive Collaborative Formation Planning for Team of Quadruped Robots in Cluttered Environments [15.679419362625845]
本稿では,四足歩行ロボットのための役割適応型リーダ・フォロワー型構成計画・制御フレームワークを提案する。
固定的なリーダーや堅固な構成の役割を持つ従来の手法とは異なり、提案手法は動的役割割り当てと部分的な目標計画を統合している。
その結果、複雑で非構造的な環境での円滑な調整、適応的な役割の切り替え、ロバストな構成維持が示された。
論文 参考訳(メタデータ) (2026-02-20T14:44:16Z) - Dynamic Obstacle Avoidance with Bounded Rationality Adversarial Reinforcement Learning [5.760394464143113]
本稿では,障害物を敵エージェントとしてモデル化するトレーニングプロセスにより,ロバスト性のあるナビゲーションポリシーを実現する新しい手法を提案する。
我々はこの手法を、量子応答適応強化学習(Hi-QARL)による多元的ポリシーと呼ぶ。
論文 参考訳(メタデータ) (2025-03-14T14:54:02Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - RObotic MAnipulation Network (ROMAN) -- Hybrid Hierarchical Learning for Solving Complex Sequential Tasks [45.3746654854308]
ロボットマニピュレーションネットワーク(ROMAN)のハイブリッド階層型学習フレームワークを提案する。
ROMANは、行動クローニング、模倣学習、強化学習を統合することで、タスクの汎用性と堅牢な障害回復を実現する。
実験結果から,これらの専門的な操作専門家の組織化と活性化により,ROMANは高度な操作タスクの長いシーケンスを達成するための適切なシーケンシャルなアクティベーションを生成することがわかった。
論文 参考訳(メタデータ) (2023-06-30T20:35:22Z) - Learning Robotic Manipulation Skills Using an Adaptive Force-Impedance
Action Space [7.116986445066885]
強化学習は、様々な困難な意思決定タスクにおいて、有望な結果をもたらしました。
高速な人間のような適応制御手法は複雑なロボットの相互作用を最適化するが、非構造化タスクに必要なマルチモーダルフィードバックを統合することができない。
本稿では,階層的学習と適応アーキテクチャにおける学習問題を要因として,両世界を最大限に活用することを提案する。
論文 参考訳(メタデータ) (2021-10-19T12:09:02Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。