Fugu-MT 論文翻訳(概要): QuadSim: A Quadcopter Rotational Dynamics Simulation Framework For Reinforcement Learning Algorithms

論文の概要: QuadSim: A Quadcopter Rotational Dynamics Simulation Framework For Reinforcement Learning Algorithms

arxiv url: http://arxiv.org/abs/2202.07021v1
Date: Mon, 14 Feb 2022 20:34:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-16 13:58:06.208415
Title: QuadSim: A Quadcopter Rotational Dynamics Simulation Framework For Reinforcement Learning Algorithms
Title（参考訳）: quadsim:強化学習アルゴリズムのためのクワッドコプター回転動力学シミュレーションフレームワーク
Authors: Burak Han Demirbilek
Abstract要約: 本研究は,数式に基づくクアッドコプター回転動力学シミュレーションフレームワークの設計と開発に焦点をあてる。このフレームワークは、クワッドコプターの線形表現と非線形表現の両方をシミュレートすることを目的としている。シミュレーション環境はOpenAI Gymツールキットと互換性を持つように拡張された。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This study focuses on designing and developing a mathematically based quadcopter rotational dynamics simulation framework for testing reinforcement learning (RL) algorithms in many flexible configurations. The design of the simulation framework aims to simulate both linear and nonlinear representations of a quadcopter by solving initial value problems for ordinary differential equation (ODE) systems. In addition, the simulation environment is capable of making the simulation deterministic/stochastic by adding random Gaussian noise in the forms of process and measurement noises. In order to ensure that the scope of this simulation environment is not limited only with our own RL algorithms, the simulation environment has been expanded to be compatible with the OpenAI Gym toolkit. The framework also supports multiprocessing capabilities to run simulation environments simultaneously in parallel. To test these capabilities, many state-of-the-art deep RL algorithms were trained in this simulation framework and the results were compared in detail.
Abstract（参考訳）: 本研究では,多くの柔軟な構成で強化学習(RL)アルゴリズムをテストするために,数式ベースのクアッドコプター回転動力学シミュレーションフレームワークの設計と開発に焦点をあてる。シミュレーションフレームワークの設計は、通常の微分方程式(ODE)系の初期値問題を解くことにより、クワッドコプターの線形表現と非線形表現の両方をシミュレートすることを目的としている。さらに、プロセスの形式や測定ノイズにランダムなガウスノイズを加えることにより、シミュレーション環境を決定論的・確率的にすることができる。このシミュレーション環境のスコープが我々のRLアルゴリズムに限らないことを保証するため、シミュレーション環境はOpenAI Gymツールキットと互換性を持つように拡張されている。このフレームワークは同時にシミュレーション環境を実行するマルチプロセス機能もサポートする。これらの機能をテストするために、このシミュレーションフレームワークで多くの最先端の深部RLアルゴリズムを訓練し、その結果を詳細に比較した。

関連論文リスト

Dynamic SBI: Round-free Sequential Simulation-Based Inference with Adaptive Datasets [0.9134244356393665]
ラウンドフリーで非同期で並列性の高い方法でシーケンシャルメソッドのコアアイデアを実装した動的SBIを導入する。中心となるのは、ターゲット観測に類似するように推論中に反復的に変換される適応データセットである。我々は,動的SBIが推論性能を維持しながらシミュレーション効率を大幅に向上できることを実証した。
論文参考訳（メタデータ） (2025-10-15T18:24:52Z)
G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration [48.948187359727996]
G-Simは、厳密な経験的校正によるシミュレータ構築を自動化するハイブリッドフレームワークである。信頼性のある因果的インフォームドシミュレータを生成し、データ効率を軽減し、堅牢なシステムレベルの介入を可能にする。
論文参考訳（メタデータ） (2025-06-10T22:14:34Z)
Flow Matching for Geometric Trajectory Simulation [4.271235935891555]
N体系は、分子動力学、生化学、歩行者動力学など幅広い分野の応用において基本的な問題である。機械学習は、物理ベースのシミュレータをスケールし、実験データから直接モデルを開発する上で、貴重なツールとなっている。現実的な軌跡を生成するためには、既存の手法は、非情報ノイズから始まる複雑な変換を学習し、ドメインインフォームド先行の活用を許さない必要がある。本稿では,この制限に対処するためにSTFlowを提案する。フローマッチングとデータ依存結合を利用して,モデル表現率やスケーラビリティを犠牲にすることなく,幾何学的軌道の物理インフォームドシミュレーションを容易にする。
論文参考訳（メタデータ） (2025-05-24T11:18:59Z)
GausSim: Foreseeing Reality by Gaussian Simulator for Elastic Objects [55.02281855589641]
GausSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。我々は連続体力学を活用し、各カーネルを連続体を表すCenter of Mass System (CMS)として扱う。さらに、ガウスシムは質量や運動量保存のような明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文参考訳（メタデータ） (2024-12-23T18:58:17Z)
Stabilizing Reinforcement Learning in Differentiable Multiphysics Simulation [11.360832156847103]
本稿では,剛体や変形物を含むタスクにおけるRLのスケーリングを実現するための,新しいRLアルゴリズムとシミュレーションプラットフォームを提案する。我々は,最大エントロピー1次モデルに基づくRLアルゴリズムであるSoft Analytic Policy (SAPO)を導入する。また,剛体以外の様々な材料を模擬する並列微分可能多物理シミュレーションプラットフォームであるRewarpedを開発した。
論文参考訳（メタデータ） (2024-12-16T18:56:24Z)
Learning Quadruped Locomotion Using Differentiable Simulation [31.80380408663424]
微分可能シミュレーションは、高速収束と安定した訓練を約束する。本研究はこれらの課題を克服するための新しい微分可能シミュレーションフレームワークを提案する。我々のフレームワークは並列化なしで数分で四足歩行を学習できる。
論文参考訳（メタデータ） (2024-03-21T22:18:59Z)
Informal Safety Guarantees for Simulated Optimizers Through Extrapolation from Partial Simulations [0.0]
自己教師付き学習は、最先端の言語モデリングのバックボーンである。自己教師付きデータセットにおける予測損失を伴うトレーニングはシミュレータを引き起こすと論じられている。
論文参考訳（メタデータ） (2023-11-29T09:32:56Z)
Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。 TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文参考訳（メタデータ） (2023-10-12T20:49:15Z)
Continual learning autoencoder training for a particle-in-cell simulation via streaming [52.77024349608834]
今後のエクサスケール時代は次世代の物理シミュレーションを高解像度で提供しますこれらのシミュレーションは高解像度であり、ディスク上に大量のシミュレーションデータを格納することはほぼ不可能であるため、機械学習モデルのトレーニングに影響を与える。この研究は、ディスク上のデータなしで、実行中のシミュレーションにニューラルネットワークを同時にトレーニングするアプローチを示す。
論文参考訳（メタデータ） (2022-11-09T09:55:14Z)
Physical Systems Modeled Without Physical Laws [0.0]
ツリーベースの機械学習手法は、シミュレーションに関わる複雑なバックを「知る」ことなく、望ましい出力をエミュレートすることができる。具体的には、2つのシミュレーション出力間の特定の時空間データの予測と、数値計算を繰り返す計算コストを伴わずに、物理予測の一般化に焦点をあてる。
論文参考訳（メタデータ） (2022-07-26T20:51:20Z)
Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文参考訳（メタデータ） (2022-04-14T17:46:26Z)
ElVibRot-MPI: parallel quantum dynamics with Smolyak algorithm for general molecular simulation [0.0]
一般分子シミュレーションのためのSmolyakアルゴリズムを用いた並列量子力学パッケージを提案する。このプログラムはハミルトン形式に制限がなく、異なる問題に適応するためのシミュレーション設定に高い柔軟性を提供する。
論文参考訳（メタデータ） (2021-11-26T18:34:07Z)
Deep Bayesian Active Learning for Accelerating Stochastic Simulation [74.58219903138301]
Interactive Neural Process(INP)は、シミュレーションとアクティブな学習アプローチのためのディープラーニングフレームワークである。能動的学習のために,NPベースモデルの潜時空間で計算された新しい取得関数Latent Information Gain (LIG)を提案する。その結果,STNPは学習環境のベースラインを上回り,LIGは能動学習の最先端を達成していることがわかった。
論文参考訳（メタデータ） (2021-06-05T01:31:51Z)
SimNet: Computer Architecture Simulation using Machine Learning [3.7019798164954336]
この研究では、機械学習(ML)を使用して離散イベントシミュレーションを加速する共同作業について説明します。提案した命令遅延予測器に基づいて,GPU加速並列シミュレータを実装した。そのシミュレーション精度とスループットを、最先端シミュレータに対して検証し、評価する。
論文参考訳（メタデータ） (2021-05-12T17:31:52Z)
Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文参考訳（メタデータ） (2021-03-01T22:55:48Z)
A User's Guide to Calibrating Robotics Simulators [54.85241102329546]
本稿では,シミュレーションで学習したモデルやポリシーを現実世界に伝達することを目的とした,様々なアルゴリズムの研究のためのベンチマークとフレームワークを提案する。我々は、様々なアルゴリズムの性能に関する洞察を特徴付け、提供するために、広く知られたシミュレーション環境の実験を行う。我々の分析は、この分野の実践者にとって有用であり、sim-to-realアルゴリズムの動作と主特性について、より深い選択をすることができる。
論文参考訳（メタデータ） (2020-11-17T22:24:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。