論文の概要: Bipedalism for Quadrupedal Robots: Versatile Loco-Manipulation through Risk-Adaptive Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2507.20382v1
- Date: Sun, 27 Jul 2025 18:51:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:57.483007
- Title: Bipedalism for Quadrupedal Robots: Versatile Loco-Manipulation through Risk-Adaptive Reinforcement Learning
- Title(参考訳): 四足歩行ロボットのための二足歩行:リスク適応型強化学習による多足歩行操作
- Authors: Yuyou Zhang, Radu Corcodel, Ding Zhao,
- Abstract要約: 四足歩行ロボットに二足歩行を導入し,前肢を開放し,環境との多目的インタラクションを実現する。
後肢を歩行する四足歩行ロボットを対象としたリスク適応型分散強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.938067330028066
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Loco-manipulation of quadrupedal robots has broadened robotic applications, but using legs as manipulators often compromises locomotion, while mounting arms complicates the system. To mitigate this issue, we introduce bipedalism for quadrupedal robots, thus freeing the front legs for versatile interactions with the environment. We propose a risk-adaptive distributional Reinforcement Learning (RL) framework designed for quadrupedal robots walking on their hind legs, balancing worst-case conservativeness with optimal performance in this inherently unstable task. During training, the adaptive risk preference is dynamically adjusted based on the uncertainty of the return, measured by the coefficient of variation of the estimated return distribution. Extensive experiments in simulation show our method's superior performance over baselines. Real-world deployment on a Unitree Go2 robot further demonstrates the versatility of our policy, enabling tasks like cart pushing, obstacle probing, and payload transport, while showcasing robustness against challenging dynamics and external disturbances.
- Abstract(参考訳): 四足歩行ロボットのロコ操作はロボットの応用を拡大するが、脚をマニピュレータとして使うと移動が損なわれる。
この問題を軽減するため,四足歩行ロボットに二足歩行を導入した。
本稿では,後肢を歩行する四足歩行ロボットを対象としたリスク適応型分散強化学習(RL)フレームワークを提案する。
トレーニング中は、推定した戻り分布の変動係数によって測定された戻り値の不確実性に基づいて適応的リスク嗜好を動的に調整する。
シミュレーションにおける大規模な実験により,本手法はベースラインよりも優れた性能を示した。
実際のUnitree Go2ロボットへのデプロイは、カートプッシュ、障害物探索、ペイロード輸送といったタスクを可能にするとともに、挑戦的なダイナミックスや外部の障害に対して堅牢性を示すことで、私たちのポリシの汎用性をさらに証明します。
関連論文リスト
- GRoQ-LoCO: Generalist and Robot-agnostic Quadruped Locomotion Control using Offline Datasets [0.8678250057211367]
GRoQ-LoCOはスケーラブルで注目度の高いフレームワークで、複数の四足歩行ロボットと地形をまたいだ1つの汎用的なロコモーションポリシーを学習する。
我々のフレームワークは、ロボット固有のエンコーディングを組み込まずに、すべてのロボットからの保護的データのみを運用する。
その結果、オフラインでデータ駆動学習により、様々な4つの形態や行動にまたがる移動を一般化する可能性が示された。
論文 参考訳(メタデータ) (2025-05-16T08:17:01Z) - Training Directional Locomotion for Quadrupedal Low-Cost Robotic Systems via Deep Reinforcement Learning [4.669957449088593]
現実世界における低コスト四足歩行ロボットの方向移動の深層強化学習訓練について述べる。
我々は、動作状態遷移の探索を促進するためにロボットが従わなければならない方向のランダム化を利用する。
エピソードの先頭のリセットを現在のヨーと通常の分布から引き出されたランダムな値に変更すると、複雑な軌跡に従うことができるポリシーが得られる。
論文 参考訳(メタデータ) (2025-03-14T03:53:01Z) - Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.26816599309778]
動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文 参考訳(メタデータ) (2025-02-24T14:53:45Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [88.06408322210025]
展開中のシナリオにオンザフライで適応する問題について検討する。
ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。
ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文 参考訳(メタデータ) (2023-11-02T08:22:28Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Robust Quadruped Jumping via Deep Reinforcement Learning [10.095966161524043]
本稿では,騒音環境下での四足歩行ロボットのジャンプ距離と高さについて考察する。
本研究では,4重跳躍のための非線形軌道最適化の複雑な解を活用・拡張するディープ強化学習を用いたフレームワークを提案する。
体長2倍の体長をジャンプしながら、高さ最大6cmの足の障害の頑丈さ、あるいはロボットの名目立位の高さの33%を実証した。
論文 参考訳(メタデータ) (2020-11-13T19:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。