論文の概要: CHIP: Adaptive Compliance for Humanoid Control through Hindsight Perturbation
- arxiv url: http://arxiv.org/abs/2512.14689v1
- Date: Tue, 16 Dec 2025 18:56:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.842469
- Title: CHIP: Adaptive Compliance for Humanoid Control through Hindsight Perturbation
- Title(参考訳): CHIP:隠れた摂動によるヒューマノイド制御に対する適応的コンプライアンス
- Authors: Sirui Chen, Zi-ang Cao, Zhengyi Luo, Fernando Castañeda, Chenran Li, Tingwu Wang, Ye Yuan, Linxi "Jim" Fan, C. Karen Liu, Yuke Zhu,
- Abstract要約: hIsight Perturbation (CHIP)は、制御可能なエンドエフェクタ剛性を実現するプラグイン・アンド・プレイモジュールである。
CHIPの実装は簡単で、データ拡張も追加の報酬チューニングも必要ありません。
そこで本研究では,CHIPでトレーニングした汎用モーショントラッキングコントローラが,多種多様な操作タスクを実行できることを示す。
- 参考スコア(独自算出の注目度): 70.5382178207975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent progress in humanoid robots has unlocked agile locomotion skills, including backflipping, running, and crawling. Yet it remains challenging for a humanoid robot to perform forceful manipulation tasks such as moving objects, wiping, and pushing a cart. We propose adaptive Compliance Humanoid control through hIsight Perturbation (CHIP), a plug-and-play module that enables controllable end-effector stiffness while preserving agile tracking of dynamic reference motions. CHIP is easy to implement and requires neither data augmentation nor additional reward tuning. We show that a generalist motion-tracking controller trained with CHIP can perform a diverse set of forceful manipulation tasks that require different end-effector compliance, such as multi-robot collaboration, wiping, box delivery, and door opening.
- Abstract(参考訳): ヒューマノイドロボットの最近の進歩は、バックフリップ、ランニング、クローリングを含むアジャイルのロコモーションスキルをアンロックしている。
しかし、ヒューマノイドロボットが物体を動かしたり、拭いたり、カートを押すといった、力強い操作を行うことは、依然として困難である。
動的参照動作のアジャイルトラッキングを保ちながら、制御可能なエンドエフェクタ剛性を実現するプラグイン・アンド・プレイモジュールであるhIsight Perturbation (CHIP) による適応型コンプライアンス・ヒューマノイド制御を提案する。
CHIPの実装は簡単で、データ拡張も追加の報酬チューニングも必要ありません。
本稿では,CHIPでトレーニングした汎用モーショントラッキングコントローラが,マルチロボットコラボレーション,ワイピング,ボックス配信,ドアオープニングなど,さまざまなエンドエフェクタコンプライアンスを必要とする多種多様な操作タスクを実行できることを示す。
関連論文リスト
- KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [58.73043119128804]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文 参考訳(メタデータ) (2025-06-15T13:58:53Z) - Mobile-TeleVision: Predictive Motion Priors for Humanoid Whole-Body Control [18.269588421166503]
ヒューマノイドロボットは頑丈な下半身移動と正確な上半身操作を必要とする。
最近の強化学習アプローチは、全身のロコ操作ポリシーを提供するが、正確な操作はしていない。
Inverses (IK) と Motion を用いた高体力制御を導入し, 高精度な操作を行う。
CVAEは安定性とロバスト性に重要な特徴であり,RLによる全身制御よりも高い精度で操作できることが示唆された。
論文 参考訳(メタデータ) (2024-12-10T18:59:50Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Deep Whole-Body Control: Learning a Unified Policy for Manipulation and
Locomotion [25.35885216505385]
装着されたアームは、移動操作タスクへの脚付きロボットの適用性を著しく向上させることができる。
このような手足のマニピュレータのための標準的な階層制御パイプラインは、コントローラを操作と移動のものと分離することである。
我々は、強化学習を用いて、足のマニピュレータの全身制御のための統一的なポリシーを学習する。
論文 参考訳(メタデータ) (2022-10-18T17:59:30Z) - Agile Maneuvers in Legged Robots: a Predictive Control Approach [20.55884151818753]
そこで本研究では,ロボットがアジャイルなロコモーションスキルを計画し,実行できるようにする,接触位相予測および状態フィードバックコントローラを提案する。
私たちの研究は、予測制御がアクティベーション制限を処理し、アジャイルなロコモーション操作を生成し、別のボディコントローラを使わずに、ハードウェア上でローカルに最適なフィードバックポリシーを実行することができることを示す最初のものです。
論文 参考訳(メタデータ) (2022-03-14T23:32:17Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。