論文の概要: TrajBooster: Boosting Humanoid Whole-Body Manipulation via Trajectory-Centric Learning
- arxiv url: http://arxiv.org/abs/2509.11839v1
- Date: Mon, 15 Sep 2025 12:25:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.270641
- Title: TrajBooster: Boosting Humanoid Whole-Body Manipulation via Trajectory-Centric Learning
- Title(参考訳): TrajBooster: 軌道中心学習によるヒューマノイド全体操作の促進
- Authors: Jiacheng Liu, Pengxiang Ding, Qihang Zhou, Yuxuan Wu, Da Huang, Zimian Peng, Wei Xiao, Weinan Zhang, Lixin Yang, Cewu Lu, Donglin Wang,
- Abstract要約: イミテーション・ラーニング(IL)は、デモから効果的なスキル獲得を可能にするが、しばしば長距離作業や高精度制御に苦慮する。
我々は、残余ポリシー更新を導くために、グローバルダイナミクスモデリングを取り入れることを提案する。
具体的には、クープマン作用素理論を利用して学習潜在空間に線形時間不変構造を課す。
- 参考スコア(独自算出の注目度): 79.59753528758361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imitation learning (IL) enables efficient skill acquisition from demonstrations but often struggles with long-horizon tasks and high-precision control due to compounding errors. Residual policy learning offers a promising, model-agnostic solution by refining a base policy through closed-loop corrections. However, existing approaches primarily focus on local corrections to the base policy, lacking a global understanding of state evolution, which limits robustness and generalization to unseen scenarios. To address this, we propose incorporating global dynamics modeling to guide residual policy updates. Specifically, we leverage Koopman operator theory to impose linear time-invariant structure in a learned latent space, enabling reliable state transitions and improved extrapolation for long-horizon prediction and unseen environments. We introduce KORR (Koopman-guided Online Residual Refinement), a simple yet effective framework that conditions residual corrections on Koopman-predicted latent states, enabling globally informed and stable action refinement. We evaluate KORR on long-horizon, fine-grained robotic furniture assembly tasks under various perturbations. Results demonstrate consistent gains in performance, robustness, and generalization over strong baselines. Our findings further highlight the potential of Koopman-based modeling to bridge modern learning methods with classical control theory. For more details, please refer to https://jiachengliu3.github.io/TrajBooster.
- Abstract(参考訳): イミテーションラーニング(IL)は、デモンストレーションから効果的なスキル獲得を可能にするが、多くの場合、複雑なエラーによる長期作業や高精度制御に苦慮する。
残留ポリシー学習は、クローズドループ補正を通じて基本ポリシーを精査することで、有望でモデルに依存しないソリューションを提供する。
しかし、既存のアプローチは主に基本方針に対する局所的な修正に焦点を当てており、国家の進化のグローバルな理解が欠如しているため、堅牢性や一般化は目に見えないシナリオに限られている。
そこで我々は,残余ポリシー更新を導くために,グローバルなダイナミクスモデリングを取り入れることを提案する。
具体的には、Koopman演算子理論を利用して学習された潜在空間に線形時間不変構造を課し、信頼性のある状態遷移を可能にし、長い水平予測と目に見えない環境に対する外挿を改善する。
KORR(Koopman-guided Online Residual Refinement)は、Koopman-predicted latent stateの残差補正を条件とした、シンプルで効果的なフレームワークである。
各種摂動下でのロボット家具組立作業において, KORRを評価した。
結果は、強いベースラインに対するパフォーマンス、堅牢性、一般化において、一貫した利益を示します。
本研究は,古典的制御理論を用いた現代学習手法を橋渡しするクープマンモデルの可能性をさらに強調するものである。
詳細はhttps://jiachengliu3.github.io/TrajBoosterを参照してください。
関連論文リスト
- Conditioning Matters: Training Diffusion Policies is Faster Than You Think [69.31534053485711]
拡散政策は、視覚言語アクション(VLA)モデルを構築するための主流パラダイムとして登場した。
条件拡散政策訓練の基本的な課題は, 生成条件の識別が困難である場合, 訓練対象が限界行動分布をモデル化することである。
条件に依存しない条件付きフローマッチングにおけるソース分布を変更するソリューションであるCocosを提案する。
論文 参考訳(メタデータ) (2025-05-16T11:14:22Z) - Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Self-Regularization [77.62516752323207]
そこで本研究では,事前訓練した重みを効率よく微調整する直交微調整法を導入し,頑健さと一般化の強化を実現した。
自己正規化戦略は、OrthSRと呼ばれるVLMのゼロショット一般化の観点から安定性を維持するためにさらに活用される。
筆者らはCLIPとCoOpを再検討し,少数の画像のクラスフィシエーションシナリオにおけるモデルの改善を効果的に行う。
論文 参考訳(メタデータ) (2024-07-11T10:35:53Z) - DTC: Deep Tracking Control [16.2850135844455]
本研究では,両世界の強靭性,フット配置精度,地形の一般化を両世界の利点と組み合わせたハイブリッド制御アーキテクチャを提案する。
深層ニューラルネットワークポリシは、最適化された足場を追跡することを目的として、シミュレーションでトレーニングされている。
モデルベースに比べて滑りやすい地盤や変形可能な地盤が存在する場合の強靭性を示す。
論文 参考訳(メタデータ) (2023-09-27T07:57:37Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。