論文の概要: SoftMimic: Learning Compliant Whole-body Control from Examples
- arxiv url: http://arxiv.org/abs/2510.17792v1
- Date: Mon, 20 Oct 2025 17:49:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.550814
- Title: SoftMimic: Learning Compliant Whole-body Control from Examples
- Title(参考訳): SoftMimic: 一貫性のある全身制御を実例から学ぶ
- Authors: Gabriel B. Margolis, Michelle Wang, Nolan Fey, Pulkit Agrawal,
- Abstract要約: 我々は,人型ロボットの動作を例から学習するフレームワークであるSoftMimicを紹介した。
シミュレーションと実世界の実験により,環境との安全かつ効果的な相互作用を実証し,本手法の有効性を検証した。
- 参考スコア(独自算出の注目度): 10.040505865690498
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce SoftMimic, a framework for learning compliant whole-body control policies for humanoid robots from example motions. Imitating human motions with reinforcement learning allows humanoids to quickly learn new skills, but existing methods incentivize stiff control that aggressively corrects deviations from a reference motion, leading to brittle and unsafe behavior when the robot encounters unexpected contacts. In contrast, SoftMimic enables robots to respond compliantly to external forces while maintaining balance and posture. Our approach leverages an inverse kinematics solver to generate an augmented dataset of feasible compliant motions, which we use to train a reinforcement learning policy. By rewarding the policy for matching compliant responses rather than rigidly tracking the reference motion, SoftMimic learns to absorb disturbances and generalize to varied tasks from a single motion clip. We validate our method through simulations and real-world experiments, demonstrating safe and effective interaction with the environment.
- Abstract(参考訳): 我々は,人型ロボットの動作を例から学習するフレームワークであるSoftMimicを紹介した。
人間の動きを強化学習で模倣することで、ヒューマノイドは新しいスキルを素早く学べるが、既存の方法は、基準運動からの逸脱を積極的に修正する厳格な制御を動機付け、ロボットが予期せぬ接触に遭遇したときの不安定で不安全な行動を引き起こす。
対照的に、SoftMimicはバランスと姿勢を維持しながら、ロボットが外部の力に従順に反応することを可能にする。
提案手法では,逆キネマティクス解法を用いて,強化学習ポリシーのトレーニングに使用する,実現可能な適合動作の強化データセットを生成する。
基準動作を厳格に追跡するのではなく、適合した応答に適合するポリシーを報奨することで、SoftMimicは障害を吸収し、単一のモーションクリップからさまざまなタスクに一般化することを学ぶ。
シミュレーションと実世界の実験により,環境との安全かつ効果的な相互作用を実証し,本手法の有効性を検証した。
関連論文リスト
- Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration [58.4036440289082]
ハンドオブジェクトモーションキャプチャ(MoCap)は、大規模でコンタクトに富んだデモと、器用なロボットスコープの約束を提供する。
Dexploreは、リポジトリとトラッキングを実行し、MoCapから直接ロボット制御ポリシーを学習する、統一された単一ループ最適化である。
論文 参考訳(メタデータ) (2025-09-11T17:59:07Z) - Towards Immersive Human-X Interaction: A Real-Time Framework for Physically Plausible Motion Synthesis [51.95817740348585]
Human-Xは、様々な実体をまたいだ没入的で物理的に妥当なヒューマンインタラクションを可能にするために設計された、新しいフレームワークである。
本手法は, 自己回帰型反応拡散プランナを用いて, リアルタイムに反応と反応を同時予測する。
我々のフレームワークは、人間とロボットのインタラクションのための仮想現実インターフェースを含む、現実世界のアプリケーションで検証されている。
論文 参考訳(メタデータ) (2025-08-04T06:35:48Z) - KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [50.34487144149439]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文 参考訳(メタデータ) (2025-06-15T13:58:53Z) - Learning coordinated badminton skills for legged manipulators [12.514822343998908]
我々は,手足の移動マニピュレータがバドミントンを奏でるようにするためのアプローチを提案する。
本研究は,全身運動能力のための強化学習に基づく統一的制御政策を提案する。
本手法は,シャトルコック予測モデル,ロバスト動作制御のための制約付き強化学習,システム同定技術を含む。
論文 参考訳(メタデータ) (2025-05-29T01:26:30Z) - Dexterous Manipulation through Imitation Learning: A Survey [32.47862766672596]
イミテーションラーニング(IL)は、ロボットが専門家によるデモンストレーションから直接巧妙な操作スキルを習得できるようにすることによって、代替手段を提供する。
ILは、明示的なモデリングと大規模な試行錯誤の必要性を回避しながら、きめ細かい調整と接触ダイナミクスをキャプチャする。
私たちのゴールは、研究者や実践者たちに、この急速に進化する領域の包括的紹介を提供することです。
論文 参考訳(メタデータ) (2025-04-04T15:14:38Z) - Learning Variable Compliance Control From a Few Demonstrations for Bimanual Robot with Haptic Feedback Teleoperation System [5.497832119577795]
厳格なロボットを使った、きめ細やかな、接触に富んだ操作は、ロボット工学において重要な課題である。
外部センサを介して力を制御することでこれらの問題を緩和するために、コンプライアンス制御スキームが導入されている。
Demonstrationsからの学習は直感的な代替手段であり、ロボットは観察された動作を通じて操作を学習できる。
論文 参考訳(メタデータ) (2024-06-21T09:03:37Z) - Twisting Lids Off with Two Hands [82.21668778600414]
シミュレーションで訓練された政策を実世界へ効果的かつ効率的に移行する方法を示す。
具体的には,ボトル状物体の蓋を両手でねじる問題について考察する。
これは、バイマガル・マルチフィンガーハンドでそのような機能を実現する最初のsim-to-real RLシステムである。
論文 参考訳(メタデータ) (2024-03-04T18:59:30Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。