論文の概要: PGTT: Phase-Guided Terrain Traversal for Perceptive Legged Locomotion
- arxiv url: http://arxiv.org/abs/2510.18348v1
- Date: Tue, 21 Oct 2025 07:00:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.04214
- Title: PGTT: Phase-Guided Terrain Traversal for Perceptive Legged Locomotion
- Title(参考訳): PGTT: 足の動きを知覚するための位相ガイド付きテランのトラバーサル
- Authors: Alexandros Ntagkas, Chairi Kiourt, Konstantinos Chatzilygeroudis,
- Abstract要約: PGTT ( Phase-Guided Terrain Traversal) は、報酬形成を通じて歩行構造を純粋に強制する認識型ディープRLアプローチである。
MuJoCo(MJX)で、カリキュラムやドメインランダム化を伴う手続き的に生成された階段のような地形で訓練されたPGTTは、プッシュ障害の下で最も成功している。
- 参考スコア(独自算出の注目度): 41.99844472131922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: State-of-the-art perceptive Reinforcement Learning controllers for legged robots either (i) impose oscillator or IK-based gait priors that constrain the action space, add bias to the policy optimization and reduce adaptability across robot morphologies, or (ii) operate "blind", which struggle to anticipate hind-leg terrain, and are brittle to noise. In this paper, we propose Phase-Guided Terrain Traversal (PGTT), a perception-aware deep-RL approach that overcomes these limitations by enforcing gait structure purely through reward shaping, thereby reducing inductive bias in policy learning compared to oscillator/IK-conditioned action priors. PGTT encodes per-leg phase as a cubic Hermite spline that adapts swing height to local heightmap statistics and adds a swing- phase contact penalty, while the policy acts directly in joint space supporting morphology-agnostic deployment. Trained in MuJoCo (MJX) on procedurally generated stair-like terrains with curriculum and domain randomization, PGTT achieves the highest success under push disturbances (median +7.5% vs. the next best method) and on discrete obstacles (+9%), with comparable velocity tracking, and converging to an effective policy roughly 2x faster than strong end-to-end baselines. We validate PGTT on a Unitree Go2 using a real-time LiDAR elevation-to-heightmap pipeline, and we report preliminary results on ANYmal-C obtained with the same hyperparameters. These findings indicate that terrain-adaptive, phase-guided reward shaping is a simple and general mechanism for robust perceptive locomotion across platforms.
- Abstract(参考訳): 脚付きロボットのための最先端の知覚強化学習コントローラ
一 動作空間を制約する発振器又はIKに基づく歩行先を課し、政策最適化にバイアスを加え、ロボット形態の適応性を低下させること。
(二)後脚地形の予測に苦しむ「盲」を運転し、騒音に弱い。
本稿では,報奨形成による歩行構造を純粋に強制することにより,これらの制約を克服し,発振器/IK条件の行動前よりも政策学習における帰納バイアスを低減することによる,知覚に配慮した深いRL手法であるPGTTを提案する。
PGTTは、レッグごとの位相を3次ヘルミットスプラインとしてエンコードし、このスウィング高さを局所高度マップ統計に適応させ、スウィング位相接触ペナルティを付加する。
MuJoCo (MJX) で、手続き的に生成された階段のような地形にカリキュラムとドメインのランダム化を施し、PGTT はプッシュ障害(中間値 + 7.5% 対次のベストメソッド)と離散障害(+9%)で最高の成功を達成し、速度追跡に匹敵し、強力なエンドツーエンドベースラインの約2倍の速度で効果的なポリシーに収束する。
実時間LiDAR高位マップパイプラインを用いて,Unitree Go2上のPGTTを検証し,同じハイパーパラメータで得られたANYmal-Cについて予備的な結果を報告する。
これらの結果から, 地形適応型, 位相誘導型報酬形成は, プラットフォーム間のロコモーションの簡易かつ汎用的なメカニズムであることが示唆された。
関連論文リスト
- Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling [74.41886258801209]
本稿では,行動学習から原理的アライメントを分離する2段階の軌道計画フレームワークを提案する。
Plan-R1は計画の安全性と実現可能性を大幅に改善し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-05-23T09:22:19Z) - Integrated Sensing and Communications for Low-Altitude Economy: A Deep Reinforcement Learning Approach [20.36806314683902]
低高度経済(LAE)のための統合センシング・通信(ISAC)システムについて検討する。
所定の飛行期間における通信総和レートは、GBSとUAVの軌道でのビームフォーミングを共同最適化することにより最大化する。
本稿では, 深部強化学習(DRL)技術を活用して, 深部LAE-ISAC(Deep LAE-ISAC)と呼ばれる新しいLEE指向ISAC方式を提案する。
論文 参考訳(メタデータ) (2024-12-05T11:12:46Z) - Sparse is Enough in Fine-tuning Pre-trained Large Language Models [98.46493578509039]
我々はSparse Increment Fine-Tuning (SIFT) という勾配に基づくスパース微調整アルゴリズムを提案する。
GLUE Benchmark や Instruction-tuning などのタスクで有効性を検証する。
論文 参考訳(メタデータ) (2023-12-19T06:06:30Z) - Real-Time Motion Prediction via Heterogeneous Polyline Transformer with
Relative Pose Encoding [121.08841110022607]
既存のエージェント中心の手法は、公開ベンチマークで顕著な性能を示した。
K-nearest neighbor attention with relative pose encoding (KNARPE) は、トランスフォーマーがペアワイズ相対表現を使用できる新しいアテンション機構である。
エージェント間でコンテキストを共有し、変化しないコンテキストを再利用することで、私たちのアプローチはシーン中心のメソッドと同じくらい効率的になり、最先端のエージェント中心のメソッドと同等に実行されます。
論文 参考訳(メタデータ) (2023-10-19T17:59:01Z) - Integrating Higher-Order Dynamics and Roadway-Compliance into
Constrained ILQR-based Trajectory Planning for Autonomous Vehicles [3.200238632208686]
軌道計画は、自動運転車のグローバルな最適ルートを作成することを目的としている。
既存の自転車キネマティックモデルを用いた実装では、制御可能な軌道は保証できない。
このモデルを、曲率と長手ジャークの1階および2階微分を含む高階項で拡張する。
論文 参考訳(メタデータ) (2023-09-25T22:30:18Z) - SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory
Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。
具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。
可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:17:42Z) - Multi-Agent Path Planning based on MPC and DDPG [14.793341914236166]
モデル予測制御(MPC)とDeep Deterministic Policy Gradient(DDPG)を組み合わせた新しいアルゴリズムを提案する。
ddpg with continuous action spaceは、ロボットに学習と自律的な意思決定機能を提供するように設計されている。
航空母艦デッキや四角形などの不確定な環境でのシミュレーション実験にunity 3dを用いる。
論文 参考訳(メタデータ) (2021-02-26T02:57:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。