論文の概要: NODEC: Neural ODE For Optimal Control of Unknown Dynamical Systems
- arxiv url: http://arxiv.org/abs/2401.01836v1
- Date: Wed, 3 Jan 2024 17:05:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-04 13:35:25.410950
- Title: NODEC: Neural ODE For Optimal Control of Unknown Dynamical Systems
- Title(参考訳): nodec:未知力学系の最適制御のためのニューラルode
- Authors: Cheng Chi
- Abstract要約: NODECは未知の力学系を制御するための新しいフレームワークである。
動的モデリングとコントローラのトレーニングを結合したニューラルODEモデルで組み合わせる。
我々は,未知の力学系の最適制御を学習するためのNODECの有効性とデータ効率を実証した。
- 参考スコア(独自算出の注目度): 13.727727205587804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Controlling complex dynamical systems is generally associated with minimizing
certain control objectives with known dynamics under the variational calculus
framework. For systems with unknown dynamics, an additional step of dynamics
modeling is required. However, any inaccuracy in dynamics modeling will lead to
sub-optimality in the resulting control function. Another set of approaches for
controlling unknown dynamical systems - reinforcement learning, folds the
dynamics modeling into controller training via value function approximation or
policy gradient through extensively interacting with the environment, but it
suffers from low data efficiency. To address these, we introduce NODEC, a novel
framework for controlling unknown dynamical systems, which combines dynamics
modelling and controller training using a coupled neural ODE model. Through an
intriguing interplay between the two coupled neural networks, NODEC learns
system dynamics as well as optimal controls that guides the unknown dynamical
system towards target states. Our experiments demonstrate the effectiveness and
data efficiency of NODEC for learning optimal control of unknown dynamical
systems.
- Abstract(参考訳): 複雑な力学系の制御は、変分解析の枠組みの下で既知の力学と特定の制御対象を最小化することと一般的に関係している。
未知のダイナミクスを持つシステムには、動的モデリングのさらなるステップが必要である。
しかしながら、動的モデリングの不正確さは、結果として生じる制御関数の準最適性をもたらす。
未知の動的システムを制御するための別のアプローチ - 強化学習 — は、値関数近似やポリシー勾配を通じて、コントローラのトレーニングに動的モデリングを折り畳み、環境と広範囲に相互作用するが、データ効率の低下に悩まされる。
そこで我々は,未知の力学系を制御する新しいフレームワークであるNODECを紹介した。
2つの結合したニューラルネットワーク間の興味深い相互作用を通じて、NODECはシステムのダイナミクスと、未知の力学系をターゲット状態へと導く最適な制御を学ぶ。
本実験は未知力学系の最適制御学習におけるnodecの有効性とデータ効率を示す。
関連論文リスト
- Receding Hamiltonian-Informed Optimal Neural Control and State Estimation for Closed-Loop Dynamical Systems [4.05766189327054]
Hamiltonian-Informed Optimal Neural (Hion) コントローラは、動的システムのためのニューラルネットワークベースの新しいクラスである。
ヒオンコントローラは将来の状態を推定し、ポントリャーギンの原理を用いて最適制御入力を計算する。
論文 参考訳(メタデータ) (2024-11-02T16:06:29Z) - Dropout MPC: An Ensemble Neural MPC Approach for Systems with Learned Dynamics [0.0]
そこで本研究では,モンテカルロのドロップアウト手法を学習システムモデルに応用した,サンプリングベースアンサンブルニューラルMPCアルゴリズムを提案する。
この手法は一般に複雑な力学を持つ不確実なシステムを対象としており、第一原理から派生したモデルは推論が難しい。
論文 参考訳(メタデータ) (2024-06-04T17:15:25Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Experimental study of Neural ODE training with adaptive solver for
dynamical systems modeling [72.84259710412293]
アダプティブと呼ばれるいくつかのODEソルバは、目の前の問題の複雑さに応じて評価戦略を適用することができる。
本稿では,動的システムモデリングのためのブラックボックスとして適応型ソルバをシームレスに利用できない理由を示すための簡単な実験について述べる。
論文 参考訳(メタデータ) (2022-11-13T17:48:04Z) - The least-control principle for learning at equilibrium [65.2998274413952]
我々は、平衡反復ニューラルネットワーク、深層平衡モデル、メタラーニングを学ぶための新しい原理を提案する。
私たちの結果は、脳がどのように学習するかを明らかにし、幅広い機械学習問題にアプローチする新しい方法を提供します。
論文 参考訳(メタデータ) (2022-07-04T11:27:08Z) - Near-optimal control of dynamical systems with neural ordinary
differential equations [0.0]
ディープラーニングとニューラルネットワークに基づく最適化の最近の進歩は、高次元力学系を含む制御問題を解くのに役立つ方法の開発に寄与している。
まず、時間を通して切り詰められた非切り抜きのバックプロパゲーションが、実行時のパフォーマンスとニューラルネットワークが最適な制御関数を学習する能力にどのように影響するかを分析する。
論文 参考訳(メタデータ) (2022-06-22T14:11:11Z) - Improving Coherence and Consistency in Neural Sequence Models with
Dual-System, Neuro-Symbolic Reasoning [49.6928533575956]
我々は、神経系1と論理系2の間を仲介するために神経推論を用いる。
強靭なストーリー生成とグラウンドド・インストラクション・フォローリングの結果、このアプローチは神経系世代におけるコヒーレンスと精度を高めることができることを示した。
論文 参考訳(メタデータ) (2021-07-06T17:59:49Z) - Credit Assignment in Neural Networks through Deep Feedback Control [59.14935871979047]
ディープフィードバックコントロール(Deep Feedback Control, DFC)は、フィードバックコントローラを使用して、望ましい出力ターゲットにマッチするディープニューラルネットワークを駆動し、クレジット割り当てに制御信号を使用する新しい学習方法である。
学習規則は空間と時間において完全に局所的であり、幅広い接続パターンに対するガウス・ニュートンの最適化を近似する。
さらに,DFCと皮質錐体ニューロンのマルチコンパートメントモデルと,局所的な電圧依存性のシナプス可塑性規則を関連づける。
論文 参考訳(メタデータ) (2021-06-15T05:30:17Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Deep Learning of Koopman Representation for Control [0.0]
提案手法は、制御のために、Deep Neural NetworkベースのKoopman演算子の学習に依存する。
コントローラは純粋にデータ駆動であり、事前のドメイン知識に依存しない。
本手法は,OpenAI Gym環境上の2つの古典力学系に適用し,その性能を実証する。
論文 参考訳(メタデータ) (2020-10-15T06:41:24Z) - DyNODE: Neural Ordinary Differential Equations for Dynamics Modeling in
Continuous Control [0.0]
本稿では,ニューラル常微分方程式の枠組みに制御を組み込むことにより,システムの基盤となる力学を捉える新しい手法を提案する。
以上の結果から,アクター批判強化学習アルゴリズムと組み合わせた単純なDyNODEアーキテクチャが,標準ニューラルネットワークより優れていることが示唆された。
論文 参考訳(メタデータ) (2020-09-09T12:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。