論文の概要: QuadSim: A Quadcopter Rotational Dynamics Simulation Framework For
Reinforcement Learning Algorithms
- arxiv url: http://arxiv.org/abs/2202.07021v1
- Date: Mon, 14 Feb 2022 20:34:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-16 13:58:06.208415
- Title: QuadSim: A Quadcopter Rotational Dynamics Simulation Framework For
Reinforcement Learning Algorithms
- Title(参考訳): quadsim:強化学習アルゴリズムのためのクワッドコプター回転動力学シミュレーションフレームワーク
- Authors: Burak Han Demirbilek
- Abstract要約: 本研究は,数式に基づくクアッドコプター回転動力学シミュレーションフレームワークの設計と開発に焦点をあてる。
このフレームワークは、クワッドコプターの線形表現と非線形表現の両方をシミュレートすることを目的としている。
シミュレーション環境はOpenAI Gymツールキットと互換性を持つように拡張された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study focuses on designing and developing a mathematically based
quadcopter rotational dynamics simulation framework for testing reinforcement
learning (RL) algorithms in many flexible configurations. The design of the
simulation framework aims to simulate both linear and nonlinear representations
of a quadcopter by solving initial value problems for ordinary differential
equation (ODE) systems. In addition, the simulation environment is capable of
making the simulation deterministic/stochastic by adding random Gaussian noise
in the forms of process and measurement noises. In order to ensure that the
scope of this simulation environment is not limited only with our own RL
algorithms, the simulation environment has been expanded to be compatible with
the OpenAI Gym toolkit. The framework also supports multiprocessing
capabilities to run simulation environments simultaneously in parallel. To test
these capabilities, many state-of-the-art deep RL algorithms were trained in
this simulation framework and the results were compared in detail.
- Abstract(参考訳): 本研究では,多くの柔軟な構成で強化学習(RL)アルゴリズムをテストするために,数式ベースのクアッドコプター回転動力学シミュレーションフレームワークの設計と開発に焦点をあてる。
シミュレーションフレームワークの設計は、通常の微分方程式(ODE)系の初期値問題を解くことにより、クワッドコプターの線形表現と非線形表現の両方をシミュレートすることを目的としている。
さらに、プロセスの形式や測定ノイズにランダムなガウスノイズを加えることにより、シミュレーション環境を決定論的・確率的にすることができる。
このシミュレーション環境のスコープが我々のRLアルゴリズムに限らないことを保証するため、シミュレーション環境はOpenAI Gymツールキットと互換性を持つように拡張されている。
このフレームワークは同時にシミュレーション環境を実行するマルチプロセス機能もサポートする。
これらの機能をテストするために、このシミュレーションフレームワークで多くの最先端の深部RLアルゴリズムを訓練し、その結果を詳細に比較した。
関連論文リスト
- GauSim: Registering Elastic Objects into Digital World by Gaussian Simulator [55.02281855589641]
GauSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。
我々は連続体力学を活用し、各カーネルを連続体としてモデル化し、理想化された仮定なしに現実的な変形を考慮に入れた。
ガウシムは質量や運動量保存などの明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文 参考訳(メタデータ) (2024-12-23T18:58:17Z) - Stabilizing Reinforcement Learning in Differentiable Multiphysics Simulation [11.360832156847103]
本稿では,剛体や変形物を含むタスクにおけるRLのスケーリングを実現するための,新しいRLアルゴリズムとシミュレーションプラットフォームを提案する。
我々は,最大エントロピー1次モデルに基づくRLアルゴリズムであるSoft Analytic Policy (SAPO)を導入する。
また,剛体以外の様々な材料を模擬する並列微分可能多物理シミュレーションプラットフォームであるRewarpedを開発した。
論文 参考訳(メタデータ) (2024-12-16T18:56:24Z) - Learning Quadruped Locomotion Using Differentiable Simulation [31.80380408663424]
微分可能シミュレーションは、高速収束と安定した訓練を約束する。
本研究はこれらの課題を克服するための新しい微分可能シミュレーションフレームワークを提案する。
我々のフレームワークは並列化なしで数分で四足歩行を学習できる。
論文 参考訳(メタデータ) (2024-03-21T22:18:59Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - Physical Systems Modeled Without Physical Laws [0.0]
ツリーベースの機械学習手法は、シミュレーションに関わる複雑なバックを「知る」ことなく、望ましい出力をエミュレートすることができる。
具体的には、2つのシミュレーション出力間の特定の時空間データの予測と、数値計算を繰り返す計算コストを伴わずに、物理予測の一般化に焦点をあてる。
論文 参考訳(メタデータ) (2022-07-26T20:51:20Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - ElVibRot-MPI: parallel quantum dynamics with Smolyak algorithm for
general molecular simulation [0.0]
一般分子シミュレーションのためのSmolyakアルゴリズムを用いた並列量子力学パッケージを提案する。
このプログラムはハミルトン形式に制限がなく、異なる問題に適応するためのシミュレーション設定に高い柔軟性を提供する。
論文 参考訳(メタデータ) (2021-11-26T18:34:07Z) - Deep Bayesian Active Learning for Accelerating Stochastic Simulation [74.58219903138301]
Interactive Neural Process(INP)は、シミュレーションとアクティブな学習アプローチのためのディープラーニングフレームワークである。
能動的学習のために,NPベースモデルの潜時空間で計算された新しい取得関数Latent Information Gain (LIG)を提案する。
その結果,STNPは学習環境のベースラインを上回り,LIGは能動学習の最先端を達成していることがわかった。
論文 参考訳(メタデータ) (2021-06-05T01:31:51Z) - SimNet: Computer Architecture Simulation using Machine Learning [3.7019798164954336]
この研究では、機械学習(ML)を使用して離散イベントシミュレーションを加速する共同作業について説明します。
提案した命令遅延予測器に基づいて,GPU加速並列シミュレータを実装した。
そのシミュレーション精度とスループットを、最先端シミュレータに対して検証し、評価する。
論文 参考訳(メタデータ) (2021-05-12T17:31:52Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z) - A User's Guide to Calibrating Robotics Simulators [54.85241102329546]
本稿では,シミュレーションで学習したモデルやポリシーを現実世界に伝達することを目的とした,様々なアルゴリズムの研究のためのベンチマークとフレームワークを提案する。
我々は、様々なアルゴリズムの性能に関する洞察を特徴付け、提供するために、広く知られたシミュレーション環境の実験を行う。
我々の分析は、この分野の実践者にとって有用であり、sim-to-realアルゴリズムの動作と主特性について、より深い選択をすることができる。
論文 参考訳(メタデータ) (2020-11-17T22:24:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。