論文の概要: PILOT: A Perceptive Integrated Low-level Controller for Loco-manipulation over Unstructured Scenes
- arxiv url: http://arxiv.org/abs/2601.17440v1
- Date: Sat, 24 Jan 2026 12:25:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.935867
- Title: PILOT: A Perceptive Integrated Low-level Controller for Loco-manipulation over Unstructured Scenes
- Title(参考訳): PILOT:非構造化シーンに対するロコ操作のための知覚的低レベル制御
- Authors: Xinru Cui, Linxi Feng, Yixuan Zhou, Haoqi Han, Zhe Liu, Hesheng Wang,
- Abstract要約: PILOTは知覚的ロコ操作に適した単段階強化学習フレームワークである。
知覚的な移動と1つのポリシー内での全身制御をシナジー化する。
PILOTは、既存のベースラインと比較して、安定性、コマンド追跡精度、地形トラバーサビリティが優れている。
- 参考スコア(独自算出の注目度): 18.916978556216097
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid robots hold great potential for diverse interactions and daily service tasks within human-centered environments, necessitating controllers that seamlessly integrate precise locomotion with dexterous manipulation. However, most existing whole-body controllers lack exteroceptive awareness of the surrounding environment, rendering them insufficient for stable task execution in complex, unstructured scenarios.To address this challenge, we propose PILOT, a unified single-stage reinforcement learning (RL) framework tailored for perceptive loco-manipulation, which synergizes perceptive locomotion and expansive whole-body control within a single policy. To enhance terrain awareness and ensure precise foot placement, we design a cross-modal context encoder that fuses prediction-based proprioceptive features with attention-based perceptive representations. Furthermore, we introduce a Mixture-of-Experts (MoE) policy architecture to coordinate diverse motor skills, facilitating better specialization across distinct motion patterns. Extensive experiments in both simulation and on the physical Unitree G1 humanoid robot validate the efficacy of our framework. PILOT demonstrates superior stability, command tracking precision, and terrain traversability compared to existing baselines. These results highlight its potential to serve as a robust, foundational low-level controller for loco-manipulation in unstructured scenes.
- Abstract(参考訳): ヒューマノイドロボットは、人間中心の環境での多様なインタラクションや日々のサービスタスクに大きな可能性を秘めている。
しかし、既存の全体制御系では、周囲環境に対する知覚的認識が欠如しており、複雑な非構造シナリオにおける安定したタスク実行には不十分であり、この課題に対処するために、知覚的ロコ操作に適した統合された単一段階強化学習(RL)フレームワークであるPILOTを提案する。
地形の認識を高め、正確な足の配置を確保するために、注意に基づく知覚表現と予測に基づく受容的特徴を融合させるクロスモーダルなコンテキストエンコーダを設計する。
さらに,様々な運動技術を調整するためのMixture-of-Experts (MoE) ポリシーアーキテクチャを導入する。
シミュレーションおよび物理的Unitree G1ヒューマノイドロボットにおける広範囲な実験により,本フレームワークの有効性が検証された。
PILOTは、既存のベースラインと比較して、安定性、コマンド追跡精度、地形トラバーサビリティが優れている。
これらの結果は、非構造シーンにおけるロコ操作のための堅牢で基礎的な低レベルコントローラとして機能する可能性を強調している。
関連論文リスト
- ACLM: ADMM-Based Distributed Model Predictive Control for Collaborative Loco-Manipulation [9.708461585583791]
重荷のロコ操作による共同輸送は、脚のあるロボットにとって難しいが必須の能力である。
本研究は,ロコマニピュレーションのための分散モデル予測制御フレームワークであるマルチプライアの交互方向法を提案する。
論文 参考訳(メタデータ) (2026-03-07T08:06:51Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - Pro-HOI: Perceptive Root-guided Humanoid-Object Interaction [57.252599851031505]
本稿では,知覚根誘導型ヒューマノイドオブジェクトインタラクション,Pro-HOIを紹介する。
Pro-HOIは、堅牢なヒューマノイドロコ操作のための一般化可能なフレームワークである。
ユニツリーG1ロボットの実証検証は、Pro-HOIが一般化と堅牢性においてベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2026-03-01T14:19:59Z) - Admittance-Based Motion Planning with Vision-Guided Initialization for Robotic Manipulators in Self-Driving Laboratories [0.4899818550820576]
本稿では,適応的かつ適合的なロボット操作を実現するために,アプタンス制御を中心としたモーションプランニングフレームワークを提案する。
従来のスキームとは異なり、提案手法はアクセタンスコントローラを直接トラジェクトリ実行に統合する。
この能力により、人間の操作者はロボットの動きをリアルタイムでオーバーライドまたはリダイレクトすることができる。
論文 参考訳(メタデータ) (2026-01-29T13:29:56Z) - CHIP: Adaptive Compliance for Humanoid Control through Hindsight Perturbation [70.5382178207975]
hIsight Perturbation (CHIP)は、制御可能なエンドエフェクタ剛性を実現するプラグイン・アンド・プレイモジュールである。
CHIPの実装は簡単で、データ拡張も追加の報酬チューニングも必要ありません。
そこで本研究では,CHIPでトレーニングした汎用モーショントラッキングコントローラが,多種多様な操作タスクを実行できることを示す。
論文 参考訳(メタデータ) (2025-12-16T18:56:04Z) - Executable Analytic Concepts as the Missing Link Between VLM Insight and Precise Manipulation [70.8381970762877]
VLM(Vision-Language Models)は、セマンティック推論とタスク計画において顕著な能力を示す。
本稿では,VLMに基づく推論を実行可能な解析概念を通じて基礎づける新しいフレームワークであるGRACEを紹介する。
G GRACEは高レベル命令理解と低レベルロボット制御の統一的で解釈可能なインターフェースを提供する。
論文 参考訳(メタデータ) (2025-10-09T09:08:33Z) - Decentralized Vision-Based Autonomous Aerial Wildlife Monitoring [55.159556673975544]
野生生物モニタリングのための分散視覚に基づくマルチクワッドロータシステムを提案する。
我々のアプローチは、その自然生息地における大型種のロバスト同定と追跡を可能にする。
論文 参考訳(メタデータ) (2025-08-20T20:05:05Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。