論文の概要: Feasibility-Guided Planning over Multi-Specialized Locomotion Policies
- arxiv url: http://arxiv.org/abs/2602.07932v1
- Date: Sun, 08 Feb 2026 11:58:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.263875
- Title: Feasibility-Guided Planning over Multi-Specialized Locomotion Policies
- Title(参考訳): 多機能ロコモーション政策における可能性誘導型計画法
- Authors: Ying-Sheng Luo, Lu-Ching Wang, Hanjaya Mandala, Yu-Lun Chou, Guilherme Christmann, Yu-Chung Chen, Yung-Shun Chan, Chun-Yi Lee, Wei-Chao Chen,
- Abstract要約: 本稿では,複数の地形特異的ポリシーをうまく組み込んだ実現可能性誘導型計画フレームワークを提案する。
提案手法は, 多様な, 挑戦的な地形にまたがる信頼性の高い計画を効率的に生成すると同時に, 基礎となる政策の能力と一貫して一致させる。
- 参考スコア(独自算出の注目度): 13.974935414675514
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Planning over unstructured terrain presents a significant challenge in the field of legged robotics. Although recent works in reinforcement learning have yielded various locomotion strategies, planning over multiple experts remains a complex issue. Existing approaches encounter several constraints: traditional planners are unable to integrate skill-specific policies, whereas hierarchical learning frameworks often lose interpretability and require retraining whenever new policies are added. In this paper, we propose a feasibility-guided planning framework that successfully incorporates multiple terrain-specific policies. Each policy is paired with a Feasibility-Net, which learned to predict feasibility tensors based on the local elevation maps and task vectors. This integration allows classical planning algorithms to derive optimal paths. Through both simulated and real-world experiments, we demonstrate that our method efficiently generates reliable plans across diverse and challenging terrains, while consistently aligning with the capabilities of the underlying policies.
- Abstract(参考訳): 非構造的な地形を計画することは、足場ロボット工学の分野で大きな課題となっている。
近年の強化学習の研究は様々な移動戦略を生み出しているが、複数の専門家の計画が複雑である。
従来のプランナーはスキル固有のポリシーを統合することができないが、階層的な学習フレームワークはしばしば解釈可能性を失い、新しいポリシーが追加されるたびに再トレーニングが必要になる。
本稿では,複数の地形特異的ポリシーをうまく組み込んだ実現可能性誘導型計画フレームワークを提案する。
各ポリシーはFasibility-Netと組み合わせられ、ローカルな標高マップとタスクベクトルに基づいて実現可能性テンソルを予測することを学習した。
この統合により、古典的な計画アルゴリズムは最適な経路を導出することができる。
シミュレーションと実世界の両方の実験を通して,本手法は多様な,困難な地形にまたがる信頼性の高い計画を効率的に生成し,基礎となる政策の能力と一貫して一致していることを示す。
関連論文リスト
- TodoEvolve: Learning to Architect Agent Planning Systems [68.48983335970901]
TodoEvolveは、タスク固有の計画を自律的に合成し、動的に修正するメタプランニングパラダイムである。
PlanFactoryは異種計画パターンの共通インターフェースを提供する。
TodoEvolveは、経済的なAPIコストとランタイムオーバーヘッドを維持しながら、慎重に設計された計画モジュールを一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-08T06:37:01Z) - Learning to Bridge the Gap: Efficient Novelty Recovery with Planning and Reinforcement Learning [14.757429696053796]
モデルに基づく計画手法により、ロボットは様々な環境で複雑な長期タスクを解くことができる。
本稿では,橋梁政策を強化学習(Reinforcement Learning, RL)を通じて学習し,そのような新奇性に適応することを提案する。
この定式化により、エージェントはプランナーの知識を生かして迅速に学習できることを示す。
論文 参考訳(メタデータ) (2024-09-28T03:41:25Z) - HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios [24.25807334214834]
多様な複雑な駐車シナリオを扱うために,Hybrid pOlicy Path PlannEr(HOPE)を導入する。
HOPEは強化学習エージェントをReeds-Shepp曲線に統合し、多様なシナリオにまたがる効果的な計画を可能にする。
本稿では,空間および障害物分布に基づく駐車シナリオの難易度を分類するための基準を提案する。
論文 参考訳(メタデータ) (2024-05-31T02:17:51Z) - LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。
当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文 参考訳(メタデータ) (2023-12-30T02:53:45Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z) - Constructing a Good Behavior Basis for Transfer using Generalized Policy
Updates [63.58053355357644]
そこで我々は,優れた政策集合を学習する問題を考察し,組み合わせることで,目に見えない多種多様な強化学習タスクを解くことができることを示した。
理論的には、独立したポリシーのセットと呼ぶ、特定の多様なポリシーのセットにアクセスできることによって、ハイレベルなパフォーマンスを即時に達成できることが示される。
論文 参考訳(メタデータ) (2021-12-30T12:20:46Z) - Differentiable Spatial Planning using Transformers [87.90709874369192]
本研究では、長距離空間依存を計画して行動を生成する障害マップを与えられた空間計画変換器(SPT)を提案する。
エージェントが地上の真理マップを知らない環境では、エンド・ツー・エンドのフレームワークで事前訓練されたSPTを利用する。
SPTは、操作タスクとナビゲーションタスクの両方のすべてのセットアップにおいて、最先端の差別化可能なプランナーよりも優れています。
論文 参考訳(メタデータ) (2021-12-02T06:48:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。