論文の概要: SmoothTurn: Learning to Turn Smoothly for Agile Navigation with Quadrupedal Robots
- arxiv url: http://arxiv.org/abs/2603.12842v1
- Date: Fri, 13 Mar 2026 09:44:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.756241
- Title: SmoothTurn: Learning to Turn Smoothly for Agile Navigation with Quadrupedal Robots
- Title(参考訳): SmoothTurn: 四足歩行ロボットによるアジャイルナビゲーションのためのスムーズな学習
- Authors: Zunzhi You, Haolan Guo, Yunke Wang, Chang Xu,
- Abstract要約: 四足歩行ロボットは、火災救助や産業検査のような価値ある現実世界の応用に大きな可能性を秘めている。
既存のアジャイルナビゲーションのアプローチでは、ロボットが到達した後に目標位置に留まるよう促すことで、単一ゴールのリーチポリシーを学ぶのが一般的である。
学習ベースのコントロールフレームワークであるSmoothTurnを紹介します。
- 参考スコア(独自算出の注目度): 24.152874093727153
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quadrupedal robots show great potential for valuable real-world applications such as fire rescue and industrial inspection. Such applications often require urgency and the ability to navigate agilely, which in turn demands the capability to change directions smoothly while running in high speed. Existing approaches for agile navigation typically learn a single-goal reaching policy by encouraging the robot to stay at the target position after reaching there. As a result, when the policy is used to reach sequential goals that require changing directions, it cannot anticipate upcoming maneuvers or maintain momentum across the switch of goals, thereby preventing the robot from fully exploiting its agility potential. In this work, we formulate the task as sequential local navigation, extending the single-goal-conditioned local navigation formulation in prior work. We then introduce SmoothTurn, a learning-based control framework that learns to turn smoothly while running rapidly for agile sequential local navigation. The framework adopts a novel sequential goal-reaching reward, an expanded observation space with a lookahead window for future goals, and an automatic goal curriculum that progressively expands the difficulty of sampled goal sequences based on the goal-reaching performance. The trained policy can be directly deployed on real quadrupedal robots with onboard sensors and computation. Both simulation and real-world empirical results show that SmoothTurn learns an agile locomotion policy that performs smooth turning across goals, with emergent behaviors such as controlling momentum when switching goals, facing towards the future goal in advance, and planning efficient paths. We have provided video demos of the learned motions in the supplementary materials. The source code and trained policies will be made available upon acceptance.
- Abstract(参考訳): 四足歩行ロボットは、火災救助や産業検査のような価値ある現実世界の応用に大きな可能性を秘めている。
このようなアプリケーションは、しばしば緊急性を必要とし、アジャイルにナビゲートする能力を必要とします。
既存のアジャイルナビゲーションのアプローチでは、ロボットが到達した後に目標位置に留まるよう促すことで、単一ゴールのリーチポリシーを学ぶのが一般的である。
その結果、方針が変化方向を必要とする逐次目標に達するために使用される場合、次の操作を予想したり、目標の切り替えを通した運動量を維持することはできないため、ロボットがその機敏性の可能性を完全に活用するのを防ぐことができる。
本研究では,タスクを逐次ローカルナビゲーションとして定式化し,単一ゴール条件のローカルナビゲーションを前処理で拡張する。
次に、学習ベースのコントロールフレームワークであるSmoothTurnを紹介します。
フレームワークは、新たなシーケンシャルなゴール取得報酬、将来のゴールに対するルックアヘッドウィンドウを備えた拡張された観察空間、およびゴール取得性能に基づいてサンプリングされたゴールシーケンスの難易度を段階的に拡大する自動ゴールカリキュラムを採用する。
トレーニングされたポリシーは、オンボードセンサーと計算機能を備えた実際の四足歩行ロボットに直接展開することができる。
シミュレーションと実世界の実証結果は、SmoothTurnが目標をスムーズに回すアジャイルのロコモーションポリシーを学習していることを示している。
補足材料における学習動作のビデオデモを行った。
ソースコードとトレーニング済みのポリシーは、受け入れ次第利用可能になる。
関連論文リスト
- Sight Over Site: Perception-Aware Reinforcement Learning for Efficient Robotic Inspection [57.37596278863949]
本研究では,認識・認識の観点からの検査を再考する。
本稿では,目標視認性を主目的とするエンドツーエンド強化学習フレームワークを提案する。
提案手法は,既存の古典的および学習的ナビゲーション手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-09-22T15:14:02Z) - Hierarchical Reinforcement Learning for Safe Mapless Navigation with Congestion Estimation [7.339743259039457]
本稿では,階層的強化学習(HRL)を利用した安全な地図レスナビゲーションフレームワークを提案する。
その結果,HRLに基づくナビゲーションフレームワークは静的シナリオと動的シナリオの両方で優れていることがわかった。
本研究では,物理的な検証実験を行うために,TurtleBot3ロボット上にHRLベースのナビゲーションフレームワークを実装した。
論文 参考訳(メタデータ) (2025-03-15T08:03:50Z) - Towards Real-World Efficiency: Domain Randomization in Reinforcement Learning for Pre-Capture of Free-Floating Moving Targets by Autonomous Robots [0.0]
本研究では,微小重力環境下でのロボットプレグラスピングの複雑な課題に対処するために,深層強化学習に基づく制御手法を提案する。
本手法は,ソフトアクター・クリティックな手法を用いて,自由な移動物体にグリッパーが十分に接近できるように,非政治強化学習の枠組みを取り入れたものである。
プレグラスピングのアプローチタスクを効果的に学習するために,エージェントに明確で洞察に富んだフィードバックを提供する報酬関数を開発した。
論文 参考訳(メタデータ) (2024-06-10T16:54:51Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Robot path planning using deep reinforcement learning [0.0]
強化学習法は、地図のないナビゲーションタスクに代わる手段を提供する。
障害物回避と目標指向ナビゲーションタスクの両方に深部強化学習エージェントを実装した。
報酬関数の変更によるエージェントの挙動と性能の変化を解析する。
論文 参考訳(メタデータ) (2023-02-17T20:08:59Z) - Advanced Skills by Learning Locomotion and Local Navigation End-to-End [10.872193480485596]
本研究は, 深層強化学習によるエンドツーエンド政策の訓練により, 完全な問題を解決することを提案する。
実際の四足歩行ロボットにおけるポリシーの展開を実演する。
論文 参考訳(メタデータ) (2022-09-26T16:35:00Z) - Coupling Vision and Proprioception for Navigation of Legged Robots [65.59559699815512]
我々は視覚と受容の相補的な強みを利用して、脚のあるロボットでポイントゴールナビゲーションを実現する。
車輪付きロボット(LoCoBot)のベースラインよりも優れた性能を示す。
また,センサーと計算能力を備えた四足歩行ロボットに,我々のシステムを実環境に展開することも示す。
論文 参考訳(メタデータ) (2021-12-03T18:59:59Z) - ViNG: Learning Open-World Navigation with Visual Goals [82.84193221280216]
視覚的目標達成のための学習に基づくナビゲーションシステムを提案する。
提案手法は,我々がvingと呼ぶシステムが,目標条件強化学習のための提案手法を上回っていることを示す。
我々は、ラストマイル配送や倉庫検査など、現実の多くのアプリケーションでViNGを実演する。
論文 参考訳(メタデータ) (2020-12-17T18:22:32Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。