論文の概要: Walk the PLANC: Physics-Guided RL for Agile Humanoid Locomotion on Constrained Footholds
- arxiv url: http://arxiv.org/abs/2601.06286v1
- Date: Fri, 09 Jan 2026 19:56:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.720132
- Title: Walk the PLANC: Physics-Guided RL for Agile Humanoid Locomotion on Constrained Footholds
- Title(参考訳): PLANCを歩む - 制約のある足場におけるアジャイルヒューマノイドロコモーションのための物理ガイド付きRL
- Authors: Min Dai, William D. Compton, Junheng Li, Lizhi Yang, Aaron D. Ames,
- Abstract要約: 二足歩行ロボットは、制約された足場に移動する際にバランス、タイミング、接触決定を調整する必要がある。
本稿では,低次ステッピングプランナが動的に一貫した運動目標を供給できるロコモーションフレームワークを提案する。
この構造化されたステップ計画とデータ駆動型適応の組み合わせは、ヒューマノイドロボット上で正確で、アジャイルで、ハードウェアで検証されたステップストーンの移動を生み出す。
- 参考スコア(独自算出の注目度): 20.44610499489492
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bipedal humanoid robots must precisely coordinate balance, timing, and contact decisions when locomoting on constrained footholds such as stepping stones, beams, and planks -- even minor errors can lead to catastrophic failure. Classical optimization and control pipelines handle these constraints well but depend on highly accurate mathematical representations of terrain geometry, making them prone to error when perception is noisy or incomplete. Meanwhile, reinforcement learning has shown strong resilience to disturbances and modeling errors, yet end-to-end policies rarely discover the precise foothold placement and step sequencing required for discontinuous terrain. These contrasting limitations motivate approaches that guide learning with physics-based structure rather than relying purely on reward shaping. In this work, we introduce a locomotion framework in which a reduced-order stepping planner supplies dynamically consistent motion targets that steer the RL training process via Control Lyapunov Function (CLF) rewards. This combination of structured footstep planning and data-driven adaptation produces accurate, agile, and hardware-validated stepping-stone locomotion on a humanoid robot, substantially improving reliability compared to conventional model-free reinforcement-learning baselines.
- Abstract(参考訳): 二足歩行ロボットは、足踏み石、梁、板などの制約のある足場にくっつけると、バランス、タイミング、接触決定を正確に調整する必要がある。
古典的な最適化と制御パイプラインはこれらの制約をうまく処理するが、地形幾何学の高精度な数学的表現に依存しており、知覚がうるさく、あるいは不完全である場合にエラーを起こしやすい。
一方、強化学習は乱れやモデリングエラーに対して強い弾力性を示してきたが、不連続な地形に必要とされる正確な足場配置やステップシークエンシングをエンドツーエンドのポリシーで発見することは滅多にない。
これらの対照的な制限は、純粋に報酬形成に頼るのではなく、物理学に基づく構造による学習を導くアプローチを動機付けている。
本研究では,低次ステッププランナが動的に一貫した運動目標を供給し,制御リャプノフ関数(CLF)によるRLトレーニングプロセスの制御を行うロコモーションフレームワークを提案する。
この構造化足跡計画とデータ駆動型適応の組み合わせにより,人間型ロボットの精度,機敏性,ハードウェアに有意なステップストーン移動が実現され,従来のモデルレス強化学習ベースラインに比べて信頼性が大幅に向上した。
関連論文リスト
- Stabilizing Humanoid Robot Trajectory Generation via Physics-Informed Learning and Control-Informed Steering [10.372548166988127]
近年のヒューマノイドロボット制御は、人間のデータからスムーズな人間のような軌道の学習を可能にするために模倣学習に成功している。
本稿では,システムの物理と基本的な制御原理を活かした2段階の学習戦略を提案する。
本研究では, エルゴキューブ型ヒューマノイドロボットの移動挙動を解析し, 物理インフォームド・ロスが接触足の速度をゼロにする手法について検証した。
論文 参考訳(メタデータ) (2025-09-29T12:31:14Z) - KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [58.73043119128804]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文 参考訳(メタデータ) (2025-06-15T13:58:53Z) - Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。
すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。
本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文 参考訳(メタデータ) (2025-03-13T17:48:35Z) - Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.26816599309778]
動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文 参考訳(メタデータ) (2025-02-24T14:53:45Z) - DTC: Deep Tracking Control [16.2850135844455]
本研究では,両世界の強靭性,フット配置精度,地形の一般化を両世界の利点と組み合わせたハイブリッド制御アーキテクチャを提案する。
深層ニューラルネットワークポリシは、最適化された足場を追跡することを目的として、シミュレーションでトレーニングされている。
モデルベースに比べて滑りやすい地盤や変形可能な地盤が存在する場合の強靭性を示す。
論文 参考訳(メタデータ) (2023-09-27T07:57:37Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - RLOC: Terrain-Aware Legged Locomotion using Reinforcement Learning and
Optimal Control [6.669503016190925]
四元計画と制御のためのモデルベースとデータ駆動の統一的アプローチを提案する。
センサ情報と所望のベース速度コマンドを、強化学習ポリシーを用いて足踏み計画にマッピングする。
我々は、複雑な四足歩行システムであるANYmal Bの枠組みを訓練し、再訓練を必要とせず、より大きく重いロボットであるANYmal Cへの移動性を示す。
論文 参考訳(メタデータ) (2020-12-05T18:30:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。