論文の概要: Neural Time-Reversed Generalized Riccati Equation
- arxiv url: http://arxiv.org/abs/2312.09310v1
- Date: Thu, 14 Dec 2023 19:29:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 17:59:18.681182
- Title: Neural Time-Reversed Generalized Riccati Equation
- Title(参考訳): 神経時間反転一般化リッカティ方程式
- Authors: Alessandro Betti, Michele Casoni, Marco Gori, Simone Marullo, Stefano
Melacci, Matteo Tiezzi
- Abstract要約: ハミルトン方程式は、コストテートとして知られる補助変数を通して最適性の解釈を提供する。
本稿では,前向きに作業することを目的とした,新しいニューラルベースによる最適制御手法を提案する。
- 参考スコア(独自算出の注目度): 60.92253836775246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optimal control deals with optimization problems in which variables steer a
dynamical system, and its outcome contributes to the objective function. Two
classical approaches to solving these problems are Dynamic Programming and the
Pontryagin Maximum Principle. In both approaches, Hamiltonian equations offer
an interpretation of optimality through auxiliary variables known as costates.
However, Hamiltonian equations are rarely used due to their reliance on
forward-backward algorithms across the entire temporal domain. This paper
introduces a novel neural-based approach to optimal control, with the aim of
working forward-in-time. Neural networks are employed not only for implementing
state dynamics but also for estimating costate variables. The parameters of the
latter network are determined at each time step using a newly introduced local
policy referred to as the time-reversed generalized Riccati equation. This
policy is inspired by a result discussed in the Linear Quadratic (LQ) problem,
which we conjecture stabilizes state dynamics. We support this conjecture by
discussing experimental results from a range of optimal control case studies.
- Abstract(参考訳): 最適制御は、変数が力学系を操縦する最適化問題に対処し、その結果が目的関数に寄与する。
これらの問題を解決するための古典的なアプローチは、動的プログラミングとポントリャーギン最大原理である。
両方のアプローチにおいて、ハミルトン方程式は、コストテートとして知られる補助変数を通して最適性の解釈を提供する。
しかし、ハミルトン方程式は時間領域全体にわたる前向きアルゴリズムに依存しているため、ほとんど使われない。
本稿では,前向きに作業することを目的とした,新しいニューラルベースによる最適制御手法を提案する。
ニューラルネットワークは状態力学の実装だけでなく、コスト変数の推定にも使われる。
後者のネットワークのパラメータは、時間反転一般化されたRiccati方程式と呼ばれる新しい局所ポリシーを用いて各時間ステップで決定される。
この方針は、状態ダイナミクスを安定化させる線形二次問題(lq)で議論された結果に触発されている。
我々は, 最適制御ケーススタディからの実験結果について考察することで, この予想を支持する。
関連論文リスト
- Score-based Neural Ordinary Differential Equations for Computing Mean Field Control Problems [13.285775352653546]
本稿では,ディープニューラルネットワークに基づく一階および二階のスコア関数を表すニューラルディファレンシャル方程式のシステムを提案する。
本研究では,個々の雑音に対する平均粘性場制御(MFC)問題を,提案したニューラルODEシステムによって構成された制約のない最適化問題に再構成する。
論文 参考訳(メタデータ) (2024-09-24T21:45:55Z) - The cost of solving linear differential equations on a quantum computer: fast-forwarding to explicit resource counts [0.0]
一般線型常微分方程式に対する解を量子状態に符号化するコストの非漸近計算を初めて与える。
古典力学の大規模クラスの安定性がそれらの高速なフォワードを可能にすることを示す。
ヒストリー状態は常に任意の安定線型系に対して複雑性$O(T1/2)$で出力できる。
論文 参考訳(メタデータ) (2023-09-14T17:25:43Z) - Neural ODEs as Feedback Policies for Nonlinear Optimal Control [1.8514606155611764]
ニューラルネットワークをパラメータ化した微分方程式として連続時間力学をモデル化するために、ニューラル常微分方程式(ニューラルODE)を用いる。
本稿では,一般非線形最適制御問題の解法としてニューラル・オードとして提案するニューラル・コントロール・ポリシーを提案する。
論文 参考訳(メタデータ) (2022-10-20T13:19:26Z) - Deep Graphic FBSDEs for Opinion Dynamics Stochastic Control [27.38625075499457]
本稿では,動的・コスト関数における平均場項結合を用いた意見力学の最適制御問題の解法として,スケーラブルなディープラーニング手法を提案する。
提案したフレームワークは,超大規模問題に対する将来の応用の可能性を開く。
論文 参考訳(メタデータ) (2022-04-05T22:07:32Z) - Improved Convergence Rate of Stochastic Gradient Langevin Dynamics with
Variance Reduction and its Application to Optimization [50.83356836818667]
勾配ランゲヴィン・ダイナミクスは非エプス最適化問題を解くための最も基本的なアルゴリズムの1つである。
本稿では、このタイプの2つの変種、すなわち、分散還元ランジュバンダイナミクスと再帰勾配ランジュバンダイナミクスを示す。
論文 参考訳(メタデータ) (2022-03-30T11:39:00Z) - Continuous-Time Fitted Value Iteration for Robust Policies [93.25997466553929]
ハミルトン・ヤコビ・ベルマン方程式の解法は、制御、ロボティクス、経済学を含む多くの領域において重要である。
連続適合値反復(cFVI)とロバスト適合値反復(rFVI)を提案する。
これらのアルゴリズムは、多くの連続制御問題の非線形制御-アフィンダイナミクスと分離可能な状態とアクション報酬を利用する。
論文 参考訳(メタデータ) (2021-10-05T11:33:37Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - Meta-Solver for Neural Ordinary Differential Equations [77.8918415523446]
本研究では,ソルバ空間の変動がニューラルODEの性能を向上する方法について検討する。
解法パラメータ化の正しい選択は, 敵の攻撃に対するロバスト性の観点から, 神経odesモデルに大きな影響を与える可能性がある。
論文 参考訳(メタデータ) (2021-03-15T17:26:34Z) - Direct Optimal Control Approach to Laser-Driven Quantum Particle
Dynamics [77.34726150561087]
間接制御理論に対する頑健で柔軟な代替手段として, 直接最適制御を提案する。
この方法は、バイスタブルポテンシャルにおけるレーザー駆動のウェーブパレットダイナミクスの場合に説明される。
論文 参考訳(メタデータ) (2020-10-08T07:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。