論文の概要: Simulation Priors for Data-Efficient Deep Learning
- arxiv url: http://arxiv.org/abs/2509.05732v1
- Date: Sat, 06 Sep 2025 14:36:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.675529
- Title: Simulation Priors for Data-Efficient Deep Learning
- Title(参考訳): データ効率のよいディープラーニングのためのシミュレーション優先
- Authors: Lenart Treven, Bhavya Sukhija, Jonas Rothfuss, Stelian Coros, Florian Dörfler, Andreas Krause,
- Abstract要約: SimPELは、第一原理モデルとデータ駆動学習を効率的に組み合わせる手法である。
我々は,生物,農業,ロボットなど多様なシステムでSimPELを評価した。
意思決定において,SimPELはモデルに基づく強化学習において,シミュレーションと現実のギャップを埋めることを示した。
- 参考スコア(独自算出の注目度): 56.525770511247934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How do we enable AI systems to efficiently learn in the real-world? First-principles models are widely used to simulate natural systems, but often fail to capture real-world complexity due to simplifying assumptions. In contrast, deep learning approaches can estimate complex dynamics with minimal assumptions but require large, representative datasets. We propose SimPEL, a method that efficiently combines first-principles models with data-driven learning by using low-fidelity simulators as priors in Bayesian deep learning. This enables SimPEL to benefit from simulator knowledge in low-data regimes and leverage deep learning's flexibility when more data is available, all the while carefully quantifying epistemic uncertainty. We evaluate SimPEL on diverse systems, including biological, agricultural, and robotic domains, showing superior performance in learning complex dynamics. For decision-making, we demonstrate that SimPEL bridges the sim-to-real gap in model-based reinforcement learning. On a high-speed RC car task, SimPEL learns a highly dynamic parking maneuver involving drifting with substantially less data than state-of-the-art baselines. These results highlight the potential of SimPEL for data-efficient learning and control in complex real-world environments.
- Abstract(参考訳): AIシステムはどのようにして現実世界で効率的に学習できるのか?
第一原理モデルは自然システムをシミュレートするために広く使われているが、仮定を単純化するために現実の複雑さを捉えることができないことが多い。
対照的に、ディープラーニングアプローチは、最小限の仮定で複雑な力学を推定できるが、大きな代表的データセットを必要とする。
ベイズ深層学習における先行モデルとして低忠実度シミュレータを用いて,第一原理モデルとデータ駆動学習を効率的に組み合わせる手法であるSimPELを提案する。
これにより、SimPELは低データのレシエーションにおけるシミュレータの知識の恩恵を受け、より多くのデータが利用可能になったときにディープラーニングの柔軟性を活用することができる。
生物ドメイン,農業ドメイン,ロボットドメインを含む多様なシステム上でのSimPELの評価を行い,複雑な力学の学習において優れた性能を示した。
意思決定において,SimPELはモデルに基づく強化学習において,シミュレーションと現実のギャップを埋めることを示した。
高速RCカータスクにおいて、SimPELは最先端のベースラインよりもはるかに少ないデータでドリフトを含む非常にダイナミックな駐車操作を学習する。
これらの結果は、複雑な実環境におけるデータ効率の学習と制御におけるSimPELの可能性を強調している。
関連論文リスト
- Physics-Learning AI Datamodel (PLAID) datasets: a collection of physics simulations for machine learning [0.15469999759898032]
PLAIDは物理シミュレーションのデータセットを表現および共有するためのフレームワークである。
PLAIDはシミュレーションデータを記述するための統一標準を定義する。
PLAID標準の下で,構造力学と計算流体力学を網羅した6つのデータセットをリリースする。
論文 参考訳(メタデータ) (2025-05-05T18:59:17Z) - Learning to Walk from Three Minutes of Real-World Data with Semi-structured Dynamics Models [9.318262213262866]
コンタクトリッチシステムのための半構造化力学モデルを学習するための新しいフレームワークを提案する。
我々は,従来の手法よりもはるかに少ないデータで高精度な長距離予測を行う。
実世界のUnitree Go1四足歩行ロボットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2024-10-11T18:11:21Z) - Bridging the Sim-to-Real Gap with Bayesian Inference [53.61496586090384]
データからロボットダイナミクスを学習するためのSIM-FSVGDを提案する。
我々は、ニューラルネットワークモデルのトレーニングを規則化するために、低忠実度物理プリエンスを使用します。
高性能RCレースカーシステムにおけるSIM-to-realギャップのブリッジ化におけるSIM-FSVGDの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-25T11:29:32Z) - Hindsight States: Blending Sim and Real Task Elements for Efficient
Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。
ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。
提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文 参考訳(メタデータ) (2023-03-03T21:55:04Z) - Data-Efficient Learning for Complex and Real-Time Physical Problem
Solving using Augmented Simulation [49.631034790080406]
本稿では,大理石を円形迷路の中心まで航行する作業について述べる。
実システムと対話する数分以内に,複雑な環境で大理石を動かすことを学習するモデルを提案する。
論文 参考訳(メタデータ) (2020-11-14T02:03:08Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。