論文の概要: PolySim: Bridging the Sim-to-Real Gap for Humanoid Control via Multi-Simulator Dynamics Randomization
- arxiv url: http://arxiv.org/abs/2510.01708v1
- Date: Thu, 02 Oct 2025 06:31:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.024871
- Title: PolySim: Bridging the Sim-to-Real Gap for Humanoid Control via Multi-Simulator Dynamics Randomization
- Title(参考訳): PolySim: マルチシミュレータダイナミクスランダム化によるヒューマノイド制御のためのシミュレート・トゥ・リアルギャップのブリッジ
- Authors: Zixing Lei, Zibo Zhou, Sheng Yin, Yueru Chen, Qingyao Xu, Weixin Li, Yunhong Wang, Bowei Tang, Wei Jing, Siheng Chen,
- Abstract要約: 複数の異種シミュレータを統合するWBCトレーニングプラットフォームであるPolySimを紹介する。
理論的には、PolySimは単シミュレータトレーニングよりもシミュレータ誘導バイアスの強い上限が得られることを示す。
- 参考スコア(独自算出の注目度): 53.7088694598817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid whole-body control (WBC) policies trained in simulation often suffer from the sim-to-real gap, which fundamentally arises from simulator inductive bias, the inherent assumptions and limitations of any single simulator. These biases lead to nontrivial discrepancies both across simulators and between simulation and the real world. To mitigate the effect of simulator inductive bias, the key idea is to train policies jointly across multiple simulators, encouraging the learned controller to capture dynamics that generalize beyond any single simulator's assumptions. We thus introduce PolySim, a WBC training platform that integrates multiple heterogeneous simulators. PolySim can launch parallel environments from different engines simultaneously within a single training run, thereby realizing dynamics-level domain randomization. Theoretically, we show that PolySim yields a tighter upper bound on simulator inductive bias than single-simulator training. In experiments, PolySim substantially reduces motion-tracking error in sim-to-sim evaluations; for example, on MuJoCo, it improves execution success by 52.8 over an IsaacSim baseline. PolySim further enables zero-shot deployment on a real Unitree G1 without additional fine-tuning, showing effective transfer from simulation to the real world. We will release the PolySim code upon acceptance of this work.
- Abstract(参考訳): シミュレーションで訓練されたヒューマノイド全体体制御(WBC)ポリシーは、基本的にはシミュレータ誘導バイアス、固有の仮定、特定のシミュレータの制限から生じるシム・トゥ・リアルギャップに悩まされることが多い。
これらのバイアスはシミュレーターとシミュレーションと現実世界の両方に非自明な相違をもたらす。
シミュレータ誘導バイアスの効果を軽減するため、鍵となるアイデアは、複数のシミュレータをまたいだポリシーを共同で訓練することであり、学習したコントローラは、単一のシミュレータの仮定を越えて一般化されるダイナミクスをキャプチャすることを奨励する。
そこで我々は,複数のヘテロジニアスシミュレータを統合するWBCトレーニングプラットフォームであるPolySimを導入する。
PolySimは、単一のトレーニング実行内で異なるエンジンから並列環境を同時に起動することで、動的レベルのドメインランダム化を実現する。
理論的には、PolySimは単シミュレータトレーニングよりもシミュレータ誘導バイアスの強い上限が得られることを示す。
実験では、PolySimはsim-to-sim評価におけるモーショントラッキングエラーを大幅に低減し、例えば MuJoCo では、IsaacSim ベースラインよりも52.8 の高速化を実現している。
PolySimはさらに、さらなる微調整なしに実際のUnitree G1上でゼロショットデプロイを可能にし、シミュレーションから実世界への効果的な移行を示す。
この作業が受け入れられ次第、PolySimのコードをリリースします。
関連論文リスト
- G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration [48.948187359727996]
G-Simは、厳密な経験的校正によるシミュレータ構築を自動化するハイブリッドフレームワークである。
信頼性のある因果的インフォームドシミュレータを生成し、データ効率を軽減し、堅牢なシステムレベルの介入を可能にする。
論文 参考訳(メタデータ) (2025-06-10T22:14:34Z) - YuLan-OneSim: Towards the Next Generation of Social Simulator with Large Language Models [50.35333054932747]
本稿では,YuLan-OneSimというソーシャルシミュレータを紹介する。
ユーザは、シミュレータとの自然言語インタラクションを通じて、シミュレーションシナリオを記述し、洗練することができます。
我々は、経済学、社会学、政治、心理学、組織、人口統計学、法律、コミュニケーションを含む8つの領域にまたがる50のデフォルトシミュレーションシナリオを実装した。
論文 参考訳(メタデータ) (2025-05-12T14:05:17Z) - Real-is-Sim: Bridging the Sim-to-Real Gap with a Dynamic Digital Twin [8.498460043101499]
我々は、シミュレーションを行動クローニングパイプラインに統合するための新しいアプローチである、Real-is-simを導入する。
デプロイ前にポリシーを安全にテストする機能がない実際のメソッドや、sim-to-realメソッドとは対照的に、sim-to-realギャップを横断するために複雑な適応を必要とするsim-to-realメソッドがある。
当社のフレームワークでは,実際のハードウェア上での動作と,並列化された仮想環境での動作とをシームレスに切り替えることが可能です。
論文 参考訳(メタデータ) (2025-04-04T17:05:56Z) - Overcoming the Sim-to-Real Gap: Leveraging Simulation to Learn to Explore for Real-World RL [25.991354823569033]
多くの制度において、直接シム2リアルトランスファーは失敗する可能性があるが、シミュレータを使って一連のエフェクト探索ポリシーを学習できることが示される。
特に、低ランクのMDPの設定においては、これらの探索政策と単純で実践的なアプローチが結合していることが示される。
これは、シミュレーション転送が直接sim2real転送が失敗する環境で強化学習において証明可能な利益をもたらすという最初の証拠である。
論文 参考訳(メタデータ) (2024-10-26T19:12:27Z) - BeSimulator: A Large Language Model Powered Text-based Behavior Simulator [18.318419980796012]
本研究では,BeSimulatorをテキストベースの環境下での動作シミュレーションの試みとして提案する。
BeSimulatorはシナリオを一般化し、長距離複素シミュレーションを実現する。
本実験は, ベースラインに比べ, 挙動シミュレーションにおいて顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-24T08:37:04Z) - Zero-shot Sim2Real Adaptation Across Environments [45.44896435487879]
本稿では,実世界のシミュレートされたポリシーを模倣することを学ぶリバースアクショントランスフォーメーション(RAT)ポリシーを提案する。
RATは、新しい環境へのゼロショット適応を達成するために、Universal Policy Network上にデプロイできる。
論文 参考訳(メタデータ) (2023-02-08T11:59:07Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。