論文の概要: asRoBallet: Closing the Sim2Real Gap via Friction-Aware Reinforcement Learning for Underactuated Spherical Dynamics
- arxiv url: http://arxiv.org/abs/2604.24916v1
- Date: Mon, 27 Apr 2026 18:51:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.561017
- Title: asRoBallet: Closing the Sim2Real Gap via Friction-Aware Reinforcement Learning for Underactuated Spherical Dynamics
- Title(参考訳): AsRoBallet:不動球運動のための摩擦認識強化学習によるSim2Realギャップの閉鎖
- Authors: Fang Wan, Guangyi Huang, Tianyu Wu, Zishang Zhang, Bangchao Huang, Haoran Sun, Mingdong Chen, Chaoyang Song,
- Abstract要約: 我々は,人間型ボールボットハードウェア上での強化学習の初成功例として,AsRoBalletを紹介した。
本研究では,ETH型オムニホイールの離散ローラ力学を明示的にモデル化した高アクチュエータMuJoCoシミュレーションを提案する。
また,ゼロショットSim2Real転送を実現するFriction-Aware Reinforcement Learningフレームワークを開発した。
- 参考スコア(独自算出の注目度): 18.015135668484977
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce asRoBallet, to the best of our knowledge, the first successful deployment of reinforcement learning (RL) on a humanoid ballbot hardware. Historically, ballbots have served as a canonical benchmark for underactuated and nonholonomic control, which are characterized by a reality gap in complex friction models for wheel-sphere-ground interactions. While current literature demonstrates successful handling of 3D balancing with LQR and MPC, transitioning to actual hardware for a humanoid ballbot using RL is currently hindered by critical gaps in contact modeling, actuator latency & jitter, and safe hardware exploration, and safe hardware exploration. This study proposes a high-fidelity MuJoCo simulation that explicitly models the discrete roller mechanics of ETH-type omni-wheels, thereby capturing parasitic vibrations and contact discontinuities that are previously ignored. We also developed a Friction-Aware Reinforcement Learning framework that achieves zero-shot Sim2Real transfer by mastering the coupled rolling, lateral, and torsional friction channels at the wheel-sphere and sphere-ground interfaces. We designed asRoBallet through subtractive reconfiguration, repurposing key components from an overconstrained quadruped and integrating them into a newly designed structural frame to achieve a robust research platform at low cost. We also developed a generalized iOS ecosystem that transforms consumer electronics into a low-latency interface, enabling a single operator to orchestrate expressive humanoid maneuvers via intuitive natural motion.
- Abstract(参考訳): 我々は,人間型ボールボットハードウェア上での強化学習(RL)の最初の成功例として,AsRoBalletを紹介した。
歴史的に、ボールボットは不活性化および非ホロノミック制御のための標準ベンチマークとして機能しており、車輪と球面の相互作用のための複雑な摩擦モデルにおける現実的なギャップが特徴である。
現在の文献では、LQRとMPCによる3Dバランシングのハンドリングが成功しているが、RLを使用したヒューマノイドボールボットの実際のハードウェアへの移行は、コンタクトモデリング、アクチュエータのレイテンシとジッタ、安全なハードウェア探索、安全なハードウェア探索といった重大なギャップによって妨げられている。
本研究では,ETH型オムニホイールの離散ローラ力学を明示的にモデル化し,従来無視されていた寄生振動や接触不連続性を捉える高忠実なMuJoCoシミュレーションを提案する。
また, 車輪球面および球面界面における転動, 横方向, ねじり摩擦チャネルを習得することにより, ゼロショットSim2Realトランスファーを実現するフリクション・アウェア強化学習フレームワークを開発した。
我々は,減算的再構成によりRoBalletを設計し,過剰に制約された四角形からキーコンポーネントを再利用し,それらを新たに設計した構造枠に統合し,ロバストな研究プラットフォームを低コストで実現した。
我々はまた、消費者電子回路を低レイテンシインタフェースに変換する汎用iOSエコシステムを開発し、単一のオペレーターが直感的な自然な動きによって表現力のあるヒューマノイドの操作をオーケストレーションできるようにする。
関連論文リスト
- GS-Playground: A High-Throughput Photorealistic Simulator for Vision-Informed Robot Learning [55.272458304179025]
GS-Playgroundは、エンド・ツー・エンドの知覚学習を促進するために設計されたマルチモーダル・シミュレーション・フレームワークである。
このシステムは640x480の解像度で104 FPSのスループットを達成し、大規模な視覚的RLの障壁を著しく低減する。
論文 参考訳(メタデータ) (2026-04-28T10:05:39Z) - Physics-Informed Reinforcement Learning of Spatial Density Velocity Potentials for Map-Free Racing [73.88859384645264]
Out-Of-Distribution (OOD) の様々なレーストラックへの一般化は、機械学習(ML)を用いて、エンドツーエンド制御のためのセンサデータと車両アクチュエーターの間の数学的関係を符号化する。
本稿では,非幾何学的,物理インフォームド報酬を用いた深度測定のスペクトル分布から非線形車両動特性をパラメータ化して,ニューラルネットワーク(ANN)による車両の時間最適・乗換レース制御を推定するDRL法を提案する。
このポリシーは、経験的なパセジカタイヤモデルに似たタイヤのダイナミックスで摩擦円を最大化することで、OODトラックの12%で人間のデモより優れています。
論文 参考訳(メタデータ) (2026-04-10T17:12:07Z) - Sim-to-Real Transfer for Muscle-Actuated Robots via Generalized Actuator Networks [53.12548325396181]
柔らかい筋肉のアクティベーションと組み合わせたテンドンドライブは、より速く、より安全なロボットを可能にする。
この複雑なアクチュエータのニューラルネットワークモデルを学習するsim-to-realパイプラインを提案する。
我々は,完全にシミュレーションで訓練された,正確なゴール獲得とダイナミック・ボール・イン・カップ・ポリシーの展開に成功した。
論文 参考訳(メタデータ) (2026-04-10T16:52:54Z) - Part-Level 3D Gaussian Vehicle Generation with Joint and Hinge Axis Estimation [19.45064081855758]
シミュレーションは自動運転に不可欠であるが、現在のフレームワークは、しばしば車両を剛性資産としてモデル化し、部分レベルの調音を捉えるのに失敗する。
本稿では,単一画像やスパース多視点入力からアニマタブルな3次元ガウス車両を合成する生成フレームワークを提案する。
提案手法は2つの課題に対処する: (i) 大きな3Dアセットジェネレータは静的な品質に最適化されているが, 調音には最適化されていない; (ii) セグメンテーションだけでは運動に必要な運動パラメータは提供できない。
論文 参考訳(メタデータ) (2026-04-06T18:16:12Z) - HSImul3R: Physics-in-the-Loop Reconstruction of Simulation-Ready Human-Scene Interactions [69.43316445143408]
HSImul3Rはヒトとシーンの相互作用をシミュレーション可能な3次元再構成のための統合フレームワークである。
既存の手法は知覚とシミュレーションのギャップに悩まされており、物理エンジンの不安定性と、具体化されたAIアプリケーションの失敗につながっている。
論文 参考訳(メタデータ) (2026-03-16T17:58:33Z) - RobotDancing: Residual-Action Reinforcement Learning Enables Robust Long-Horizon Humanoid Motion Tracking [50.200035833530876]
RobotDancingはシンプルでスケーラブルなフレームワークで、残留する関節の目標を予測して、ダイナミックスの不一致を明示的に修正する。
複数分間の高エネルギー動作(ジャンプ、スピン、カートホイール)をトラッキングし、高いモーショントラッキング品質のハードウェアにゼロショットをデプロイする。
論文 参考訳(メタデータ) (2025-09-25T03:30:34Z) - Sim2Dust: Mastering Dynamic Waypoint Tracking on Granular Media [16.948852537273655]
本研究は,挑戦面上での動的ウェイポイントトラッキングのためのロバストな制御ポリシを開発するための,完全なsim-to-realフレームワークを提案する。
我々は超並列シミュレーションを利用して、プロシージャ生成環境の広範囲にわたる強化学習エージェントを訓練する。
本実験は,複数の強化学習アルゴリズムと動作平滑化フィルタを体系的に比較し,実世界の展開において最も効果的な組み合わせを同定する。
論文 参考訳(メタデータ) (2025-08-15T14:30:07Z) - Learning Humanoid Standing-up Control across Diverse Postures [27.79222176982376]
立ち上がり制御はヒューマノイドロボットにとって不可欠であり、現在の移動と移動操作システムに統合される可能性がある。
本稿では,立ち上がり制御をゼロから学習する強化学習フレームワークであるHoST(Humanoid Standing-up Control)を提案する。
実験結果から, 各種実験室および屋外環境におけるスムーズ, 安定, 頑健な立位運動が得られた。
論文 参考訳(メタデータ) (2025-02-12T13:10:09Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。