論文の概要: Data-Efficient Learning for Complex and Real-Time Physical Problem
Solving using Augmented Simulation
- arxiv url: http://arxiv.org/abs/2011.07193v2
- Date: Tue, 16 Feb 2021 02:30:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 13:19:19.012641
- Title: Data-Efficient Learning for Complex and Real-Time Physical Problem
Solving using Augmented Simulation
- Title(参考訳): Augmented Simulation を用いた複雑・リアルタイム物理問題解決のためのデータ効率学習
- Authors: Kei Ota, Devesh K. Jha, Diego Romeres, Jeroen van Baar, Kevin A.
Smith, Takayuki Semitsu, Tomoaki Oiki, Alan Sullivan, Daniel Nikovski, and
Joshua B. Tenenbaum
- Abstract要約: 本稿では,大理石を円形迷路の中心まで航行する作業について述べる。
実システムと対話する数分以内に,複雑な環境で大理石を動かすことを学習するモデルを提案する。
- 参考スコア(独自算出の注目度): 49.631034790080406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans quickly solve tasks in novel systems with complex dynamics, without
requiring much interaction. While deep reinforcement learning algorithms have
achieved tremendous success in many complex tasks, these algorithms need a
large number of samples to learn meaningful policies. In this paper, we present
a task for navigating a marble to the center of a circular maze. While this
system is very intuitive and easy for humans to solve, it can be very difficult
and inefficient for standard reinforcement learning algorithms to learn
meaningful policies. We present a model that learns to move a marble in the
complex environment within minutes of interacting with the real system.
Learning consists of initializing a physics engine with parameters estimated
using data from the real system. The error in the physics engine is then
corrected using Gaussian process regression, which is used to model the
residual between real observations and physics engine simulations. The physics
engine augmented with the residual model is then used to control the marble in
the maze environment using a model-predictive feedback over a receding horizon.
To the best of our knowledge, this is the first time that a hybrid model
consisting of a full physics engine along with a statistical function
approximator has been used to control a complex physical system in real-time
using nonlinear model-predictive control (NMPC).
- Abstract(参考訳): 人間は複雑なダイナミクスを持つ新しいシステムのタスクを素早く解き、多くの相互作用を必要としない。
深層強化学習アルゴリズムは多くの複雑なタスクで大きな成功を収めているが、これらのアルゴリズムは有意義なポリシーを学ぶために大量のサンプルを必要とする。
本稿では,円迷路の中央に大理石を移動させる作業について述べる。
このシステムは人間にとって非常に直感的で容易に解けるが、標準的な強化学習アルゴリズムが意味のあるポリシーを学ぶのは非常に困難で非効率である。
実システムと対話する数分以内に,複雑な環境で大理石を動かすことを学習するモデルを提案する。
学習は物理エンジンを初期化し、実システムからのデータを用いてパラメータを推定する。
物理エンジンの誤差は、実際の観測と物理エンジンシミュレーションの間の残差をモデル化するために使用されるガウス過程回帰を用いて補正される。
残留モデルで拡張された物理エンジンは、後退地平線上のモデル予測フィードバックを用いて迷路環境における大理石の制御に使用される。
我々の知る限りでは、非線形モデル予測制御(nmpc)を用いて複雑な物理系をリアルタイムに制御するために、統計関数近似器と共に完全な物理エンジンからなるハイブリッドモデルが使用されたのはこれが初めてである。
関連論文リスト
- FMint: Bridging Human Designed and Data Pretrained Models for Differential Equation Foundation Model [5.748690310135373]
我々は、人間設計モデルとデータ駆動モデルとのギャップを埋めるために、textbfFMintという新しいマルチモーダル基盤モデルを提案する。
FMintは、インコンテキスト学習を備えたデコーダのみのトランスフォーマーアーキテクチャに基づいて、数値データとテキストデータの両方を用いて、普遍的なエラー訂正スキームを学習する。
本研究は,従来の数値解法と比較して,精度と効率の両面から提案モデルの有効性を実証するものである。
論文 参考訳(メタデータ) (2024-04-23T02:36:47Z) - Reduced Simulations for High-Energy Physics, a Middle Ground for
Data-Driven Physics Research [0.0]
サブ原子粒子軌道再構成は高エネルギー物理実験において重要な課題である。
我々は,複雑性低減型検出器モデルとしてREDVID(REDuced VIrtual Detector)と粒子衝突イベントシミュレータコンボを提供する。
論文 参考訳(メタデータ) (2023-08-30T12:50:45Z) - Learning Controllable Adaptive Simulation for Multi-resolution Physics [86.8993558124143]
完全深層学習に基づくサロゲートモデルとして,LAMP(Learning Controllable Adaptive Simulation for Multi- resolution Physics)を導入した。
LAMPは、前方進化を学習するためのグラフニューラルネットワーク(GNN)と、空間的洗練と粗大化のポリシーを学ぶためのGNNベースのアクター批判で構成されている。
我々は,LAMPが最先端のディープラーニングサロゲートモデルより優れており,長期予測誤差を改善するために,適応的なトレードオフ計算が可能であることを実証した。
論文 参考訳(メタデータ) (2023-05-01T23:20:27Z) - Hindsight States: Blending Sim and Real Task Elements for Efficient
Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。
ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。
提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文 参考訳(メタデータ) (2023-03-03T21:55:04Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Automated Dissipation Control for Turbulence Simulation with Shell
Models [1.675857332621569]
機械学習(ML)技術の応用、特にニューラルネットワークは、画像や言語を処理する上で大きな成功を収めています。
本研究は,Gledzer-Ohkitani-yamadaシェルモデルを用いて,乱流の簡易表現を構築する。
本稿では,自己相似慣性範囲スケーリングなどの乱流の統計的特性を再構築する手法を提案する。
論文 参考訳(メタデータ) (2022-01-07T15:03:52Z) - PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable
Physics [89.81550748680245]
PasticineLabと呼ばれる新しい微分可能な物理ベンチマークを導入する。
各タスクにおいて、エージェントはマニピュレータを使用して、プラスチックを所望の構成に変形させる。
本稿では,既存の強化学習(RL)手法と勾配に基づく手法について評価する。
論文 参考訳(メタデータ) (2021-04-07T17:59:23Z) - Fast Modeling and Understanding Fluid Dynamics Systems with
Encoder-Decoder Networks [0.0]
本研究では,有限体積シミュレータを用いて,高精度な深層学習に基づくプロキシモデルを効率的に教えることができることを示す。
従来のシミュレーションと比較して、提案したディープラーニングアプローチはより高速なフォワード計算を可能にする。
深層学習モデルの重要物理パラメータに対する感度を定量化することにより、インバージョン問題を大きな加速で解くことができることを示す。
論文 参考訳(メタデータ) (2020-06-09T17:14:08Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。