論文の概要: FAME: Force-Adaptive RL for Expanding the Manipulation Envelope of a Full-Scale Humanoid
- arxiv url: http://arxiv.org/abs/2603.08961v1
- Date: Mon, 09 Mar 2026 21:49:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.1312
- Title: FAME: Force-Adaptive RL for Expanding the Manipulation Envelope of a Full-Scale Humanoid
- Title(参考訳): FAME:フルスケールヒューマノイドの操作範囲を拡大する力適応型RL
- Authors: Niraj Pudasaini, Yutong Zhang, Jensen Lavering, Alessandro Roncone, Nikolaus Correll,
- Abstract要約: 外力下でのバランスを維持することは、ヒューマノイドのバイマニュアル操作にとって重要である。
力適応型強化学習フレームワークである textbfFAME を提案する。
- 参考スコア(独自算出の注目度): 41.604822515681256
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Maintaining balance under external hand forces is critical for humanoid bimanual manipulation, where interaction forces propagate through the kinematic chain and constrain the feasible manipulation envelope. We propose \textbf{FAME}, a force-adaptive reinforcement learning framework that conditions a standing policy on a learned latent context encoding upper-body joint configuration and bimanual interaction forces. During training, we apply diverse, spherically sampled 3D forces on each hand to inject disturbances in simulation together with an upper-body pose curriculum, exposing the policy to manipulation-induced perturbations across continuously varying arm configurations. At deployment, interaction forces are estimated from the robot dynamics and fed to the same encoder, enabling online adaptation without wrist force/torque sensors. In simulation across five fixed arm configurations with randomized hand forces and commanded base heights, FAME improves mean standing success to 73.84%, compared to 51.40% for the curriculum-only baseline and 29.44% for the base policy. We further deploy the learned policy on a full-scale Unitree H12 humanoid and evaluate robustness in representative load-interaction scenarios, including asymmetric single-arm load and symmetric bimanual load. Code and videos are available on https://fame10.github.io/Fame/
- Abstract(参考訳): 外力下でのバランスを維持することは、相互作用力がキネマティックチェーンを介して伝播し、実現可能な操作エンベロープを拘束するヒューマノイドのバイマニュアル操作において重要である。
本稿では,上半身の関節構成と対人的相互作用力を符号化した学習文脈上で,立位ポリシーを規定する力適応型強化学習フレームワークである「textbf{FAME}」を提案する。
トレーニング中、各手に多様で球面的な3D力を適用し、シミュレーション中の乱れを、上半身のポーズカリキュラムと共に注入し、連続的に変化する腕構成の操作によって引き起こされる摂動に対するポリシーを明らかにする。
展開時には、ロボット力学から相互作用力を推定し、同じエンコーダに供給することで、手首の力/トルクセンサなしでオンライン適応することができる。
ランダム化された手力と命令されたベース高さを持つ5つの固定アーム構成のシミュレーションにおいて、FAMEは平均立位成功率を73.84%に改善し、カリキュラムのみのベースラインは51.40%、ベースポリシーは29.44%に改善した。
我々はさらに、学習方針をフルスケールのUnitree H12ヒューマノイド上に展開し、非対称単腕負荷や対称双対負荷を含む代表的負荷-相互作用シナリオにおける堅牢性を評価する。
コードとビデオはhttps://fame10.github.io/Fame/で公開されている。
関連論文リスト
- ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - GentleHumanoid: Learning Upper-body Compliance for Contact-rich Human and Object Interaction [14.278503723930998]
GentleHumanoidは、インピーダンス制御を全身のモーショントラッキングポリシーに統合し、上半身のコンプライアンスを実現するフレームワークである。
我々は,Unitree G1ヒューマノイドとシミュレーションの両方において,異なるレベルのコンプライアンスを必要とするタスクに対するアプローチを評価した。
論文 参考訳(メタデータ) (2025-11-06T18:59:33Z) - Feel the Force: Contact-Driven Learning from Humans [52.36160086934298]
操作中のきめ細かい力の制御は、ロボット工学における中核的な課題である。
We present FeelTheForce, a robot learning system that model human tactile behavior to learn force-sensitive control。
提案手法は,5つの力覚的操作タスクで77%の成功率を達成した,スケーラブルな人間の監督において,堅牢な低レベル力制御を実現する。
論文 参考訳(メタデータ) (2025-06-02T17:57:52Z) - ForceVLA: Enhancing VLA Models with a Force-aware MoE for Contact-rich Manipulation [62.58034332427291]
ForceVLAは、新しいエンドツーエンド操作フレームワークである。
外部力センシングは、VLAシステム内の第一級のモダリティとして扱う。
論文 参考訳(メタデータ) (2025-05-28T09:24:25Z) - ForceGrip: Reference-Free Curriculum Learning for Realistic Grip Force Control in VR Hand Manipulation [0.10995326465245926]
本稿では,現実的な手操作動作を合成する深層学習エージェントであるForceGripを紹介する。
我々は、指の位置決め、意図適応、動的安定化を含む3段階のカリキュラム学習フレームワークを採用する。
以上の結果から,ForceGripの出力制御性と信頼性は最先端の手法に比べて優れていた。
論文 参考訳(メタデータ) (2025-03-11T05:39:07Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Adaptive Feature Alignment for Adversarial Training [56.17654691470554]
CNNは通常、敵攻撃に対して脆弱であり、セキュリティに敏感なアプリケーションに脅威をもたらす。
任意の攻撃強度の特徴を生成するための適応的特徴アライメント(AFA)を提案する。
本手法は任意の攻撃強度の特徴を自動的に整列するように訓練されている。
論文 参考訳(メタデータ) (2021-05-31T17:01:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。