論文の概要: Phase-Aware Policy Learning for Skateboard Riding of Quadruped Robots via Feature-wise Linear Modulation
- arxiv url: http://arxiv.org/abs/2602.09370v1
- Date: Tue, 10 Feb 2026 03:20:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.312196
- Title: Phase-Aware Policy Learning for Skateboard Riding of Quadruped Robots via Feature-wise Linear Modulation
- Title(参考訳): 機能的線形変調による四足歩行ロボットのスケートボード化のための位相対応政策学習
- Authors: Minsung Yoon, Jeil Jeong, Sung-Eui Yoon,
- Abstract要約: 四足歩行ロボットを用いたスケートボードに適した強化学習フレームワークを提案する。
位相対応政策学習(PAPL)は、位相条件付き特徴量線形変調層をアクターおよび批評家ネットワークに統合する。
PAPLは、フェーズ間でロボット固有の知識を共有しながら、フェーズ依存の振る舞いをキャプチャする。
- 参考スコア(独自算出の注目度): 17.36641564283682
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Skateboards offer a compact and efficient means of transportation as a type of personal mobility device. However, controlling them with legged robots poses several challenges for policy learning due to perception-driven interactions and multi-modal control objectives across distinct skateboarding phases. To address these challenges, we introduce Phase-Aware Policy Learning (PAPL), a reinforcement-learning framework tailored for skateboarding with quadruped robots. PAPL leverages the cyclic nature of skateboarding by integrating phase-conditioned Feature-wise Linear Modulation layers into actor and critic networks, enabling a unified policy that captures phase-dependent behaviors while sharing robot-specific knowledge across phases. Our evaluations in simulation validate command-tracking accuracy and conduct ablation studies quantifying each component's contribution. We also compare locomotion efficiency against leg and wheel-leg baselines and show real-world transferability.
- Abstract(参考訳): スケートボードは、パーソナルモビリティデバイスの一種としてコンパクトで効率的な輸送手段を提供する。
しかし,これらを脚ロボットで制御することは,認識によるインタラクションや,スケートボードの異なるフェーズ間でのマルチモーダル制御の目的によって,政策学習にいくつかの課題を生んでいる。
これらの課題に対処するために,四足歩行ロボットを用いたスケートボードに適した強化学習フレームワークであるPAPLを導入する。
PAPLは、フェーズ条件付き特徴量線形変調層をアクターおよび批評家ネットワークに統合し、フェーズ間のロボット固有の知識を共有しながら、フェーズ依存の振る舞いをキャプチャする統一ポリシーを実現することで、スケートボードの循環的性質を活用する。
シミュレーションにおける評価では,コマンド追跡精度を検証し,各コンポーネントの寄与度を定量化するためのアブレーション研究を行った。
また,ロコモーション効率を脚と車輪脚のベースラインと比較し,実世界の移動性を示す。
関連論文リスト
- Learning Whole-Body Control for a Salamander Robot [1.321203201549798]
サラマンダーに触発された両生類脚ロボットは、複雑な水陸両生環境における応用を約束している。
多くのサンショウウオロボットは、中心パターンジェネレータ(CPG)をベースとし、ロコモーション制御のためのモデルベースコーディネート戦略に頼っていた。
強化学習(Reinforcement Learning)を用いて、主観的観察をマッピングし、共同レベルの行動に速度を指示することで、協調した運動行動が出現する。
論文 参考訳(メタデータ) (2026-03-17T15:43:15Z) - Role-Adaptive Collaborative Formation Planning for Team of Quadruped Robots in Cluttered Environments [15.679419362625845]
本稿では,四足歩行ロボットのための役割適応型リーダ・フォロワー型構成計画・制御フレームワークを提案する。
固定的なリーダーや堅固な構成の役割を持つ従来の手法とは異なり、提案手法は動的役割割り当てと部分的な目標計画を統合している。
その結果、複雑で非構造的な環境での円滑な調整、適応的な役割の切り替え、ロバストな構成維持が示された。
論文 参考訳(メタデータ) (2026-02-20T14:44:16Z) - Learning-based Adaptive Control of Quadruped Robots for Active Stabilization on Moving Platforms [15.897077968999026]
四足歩行ロボットは、地下鉄、バス、飛行機、ヨットなどの6自由度移動プラットフォーム上でのバランスのとれた課題に直面している。
本稿では,移動プラットフォーム上での学習に基づくアクティブ安定化(textitLAS-MP)について述べる。
論文 参考訳(メタデータ) (2026-02-03T10:37:40Z) - HUSKY: Humanoid Skateboarding System via Physics-Aware Whole-Body Control [67.58927286226925]
本稿では,ヒューマノイド・スケータボードシステムモデリングと物理を意識した全身制御を統合した学習ベースのフレームワークを提案する。
Unitree G1のヒューマノイドプラットフォームでの実験では、現実のシナリオにおいて、私たちのフレームワークがスケートボード上で安定的でアジャイルな操作を可能にすることが示されています。
論文 参考訳(メタデータ) (2026-02-03T07:18:01Z) - Quadrupedal Robot Skateboard Mounting via Reverse Curriculum Learning [2.201107282249874]
本研究の目的は、逆カリキュラム強化学習を用いて、四足歩行ロボットにスケートボードを装着できるようにすることである。
タスクの終端フェーズから始まり、目的を近似するために問題定義の複雑さを徐々に増大させる目標指向の方法論が採用された。
学習された方針は、スケートボードの位置と方向のバリエーションに対して堅牢性を示し、最終的にはモバイルスケートボードを含むシナリオへの移動に成功した。
論文 参考訳(メタデータ) (2025-05-10T08:17:15Z) - Generalize by Touching: Tactile Ensemble Skill Transfer for Robotic Furniture Assembly [24.161856591498825]
TEST(Tactile Ensemble Skill Transfer)は、制御ループに触覚フィードバックを組み込んだオフライン強化学習(RL)アプローチのパイオニアである。
TESTの中核となる設計は、高度計画のためのスキル移行モデルと、適応的なスキル内目標達成ポリシーのセットを学ぶことである。
その結果, TESTは90%以上の成功率を達成でき, 一般化政策の4倍以上の効率であることがわかった。
論文 参考訳(メタデータ) (2024-04-26T20:27:10Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。