論文の概要: Deluca -- A Differentiable Control Library: Environments, Methods, and
Benchmarking
- arxiv url: http://arxiv.org/abs/2102.09968v1
- Date: Fri, 19 Feb 2021 15:06:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-22 13:19:43.135018
- Title: Deluca -- A Differentiable Control Library: Environments, Methods, and
Benchmarking
- Title(参考訳): deluca -- 差別化可能なコントロールライブラリ:環境、メソッド、ベンチマーク
- Authors: Paula Gradu, John Hallman, Daniel Suo, Alex Yu, Naman Agarwal, Udaya
Ghai, Karan Singh, Cyril Zhang, Anirudha Majumdar, Elad Hazan
- Abstract要約: 我々は、微分可能な物理学とロボティクス環境のオープンソースライブラリを提示する。
ライブラリには,OpenAI Gymの古典的なコントロール設定など,いくつかのポピュラーな環境がある。
ライブラリを使用して得られた新しい科学的結果のいくつかのユースケースを提供します。
- 参考スコア(独自算出の注目度): 52.44199258132215
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an open-source library of natively differentiable physics and
robotics environments, accompanied by gradient-based control methods and a
benchmark-ing suite. The introduced environments allow auto-differentiation
through the simulation dynamics, and thereby permit fast training of
controllers. The library features several popular environments, including
classical control settings from OpenAI Gym. We also provide a novel
differentiable environment, based on deep neural networks, that simulates
medical ventilation. We give several use-cases of new scientific results
obtained using the library. This includes a medical ventilator simulator and
controller, an adaptive control method for time-varying linear dynamical
systems, and new gradient-based methods for control of linear dynamical systems
with adversarial perturbations.
- Abstract(参考訳): 本稿では,グラデーションに基づく制御手法とベンチマークスイートを併用した,ネイティブに微分可能な物理環境とロボット環境のオープンソースライブラリを提案する。
導入された環境により、シミュレーションダイナミクスによる自動微分が可能となり、コントローラの迅速なトレーニングが可能になります。
ライブラリには,OpenAI Gymの古典的なコントロール設定など,いくつかのポピュラーな環境がある。
また、深層ニューラルネットワークに基づく新しい微分可能な環境を提供し、医療換気をシミュレートする。
ライブラリを使用して得られた新しい科学的結果のいくつかのユースケースを提供します。
これには、医用人工呼吸器シミュレータと制御装置、時変線形力学系の適応制御方法、逆摂動を伴う線形力学系の新しい勾配に基づく制御方法が含まれる。
関連論文リスト
- Controlling dynamical systems to complex target states using machine
learning: next-generation vs. classical reservoir computing [68.8204255655161]
機械学習を用いた非線形力学系の制御は、システムを周期性のような単純な振る舞いに駆動するだけでなく、より複雑な任意の力学を駆動する。
まず, 従来の貯水池計算が優れていることを示す。
次のステップでは、これらの結果を異なるトレーニングデータに基づいて比較し、代わりに次世代貯水池コンピューティングを使用する別のセットアップと比較する。
その結果、通常のトレーニングデータに対して同等のパフォーマンスを提供する一方で、次世代RCは、非常に限られたデータしか利用できない状況において、著しくパフォーマンスが向上していることがわかった。
論文 参考訳(メタデータ) (2023-07-14T07:05:17Z) - Learning Variable Impedance Control for Aerial Sliding on Uneven
Heterogeneous Surfaces by Proprioceptive and Tactile Sensing [42.27572349747162]
本研究では,空中すべり作業に対する学習に基づく適応制御手法を提案する。
提案するコントローラ構造は,データ駆動制御とモデルベース制御を組み合わせたものである。
美術品間相互作用制御手法の微調整状態と比較して,追従誤差の低減と外乱拒否の改善を実現した。
論文 参考訳(メタデータ) (2022-06-28T16:28:59Z) - Control of Two-way Coupled Fluid Systems with Differentiable Solvers [22.435002906710803]
本研究では、複雑な非線形力学系を制御するためにディープニューラルネットワークを用いることを検討する。
ナヴィエ・ストークス方程式を2方向のカップリングで解き、非線形摂動を生じさせる。
提案手法を用いてトレーニングしたコントローラは,評価指標や一般化能力の点で,古典的,学習的な代替品よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:12:08Z) - An Optical Control Environment for Benchmarking Reinforcement Learning
Algorithms [7.6418236982756955]
深層強化学習は様々な科学的問題に対処する可能性がある。
本稿では,学習用コントローラのための光学シミュレーション環境を提案する。
その結果,従来のシミュレーション環境よりも環境の優位性が示された。
論文 参考訳(メタデータ) (2022-03-23T00:59:35Z) - DriveGAN: Towards a Controllable High-Quality Neural Simulation [147.6822288981004]
DriveGANと呼ばれる新しい高品質のニューラルシミュレータを紹介します。
DriveGANは、異なるコンポーネントを監督なしで切り離すことによって制御性を達成する。
実世界の運転データ160時間を含む複数のデータセットでdriveganをトレーニングします。
論文 参考訳(メタデータ) (2021-04-30T15:30:05Z) - PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable
Physics [89.81550748680245]
PasticineLabと呼ばれる新しい微分可能な物理ベンチマークを導入する。
各タスクにおいて、エージェントはマニピュレータを使用して、プラスチックを所望の構成に変形させる。
本稿では,既存の強化学習(RL)手法と勾配に基づく手法について評価する。
論文 参考訳(メタデータ) (2021-04-07T17:59:23Z) - Learning-based vs Model-free Adaptive Control of a MAV under Wind Gust [0.2770822269241973]
未知の条件下でのナビゲーション問題は、制御分野において最も重要でよく研究されている問題の一つである。
近年のモデルフリー適応制御法は, センサフィードバックから直接植物の物理的特性を学習することにより, この依存を除去することを目的としている。
提案手法は,深い強化学習フレームワークによって頑健に調整された完全状態フィードバックコントローラからなる,概念的にシンプルな学習ベースアプローチを提案する。
論文 参考訳(メタデータ) (2021-01-29T10:13:56Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Single-step deep reinforcement learning for open-loop control of laminar
and turbulent flows [0.0]
本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。
原型ポリシー最適化(PPO)アルゴリズムの新たな"退化"バージョンを組み合わせることで、学習エピソード当たり1回だけシステムを最適化するニューラルネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-06-04T16:11:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。