論文の概要: Revisiting Implicit Differentiation for Learning Problems in Optimal
Control
- arxiv url: http://arxiv.org/abs/2310.14468v2
- Date: Tue, 24 Oct 2023 13:06:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 11:25:12.920448
- Title: Revisiting Implicit Differentiation for Learning Problems in Optimal
Control
- Title(参考訳): 最適制御における学習問題に対する暗黙差分の再検討
- Authors: Ming Xu, Timothy Molloy, Stephen Gould
- Abstract要約: 本稿では,非離散的制約付き離散最適制御(COC)問題から生じる最適軌道を微分する新しい手法を提案する。
軌道導関数は時間ステップ数で線形にスケールし,モデルサイズで拡張性を大幅に向上することを示す。
- 参考スコア(独自算出の注目度): 31.622109513774635
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper proposes a new method for differentiating through optimal
trajectories arising from non-convex, constrained discrete-time optimal control
(COC) problems using the implicit function theorem (IFT). Previous works solve
a differential Karush-Kuhn-Tucker (KKT) system for the trajectory derivative,
and achieve this efficiently by solving an auxiliary Linear Quadratic Regulator
(LQR) problem. In contrast, we directly evaluate the matrix equations which
arise from applying variable elimination on the Lagrange multiplier terms in
the (differential) KKT system. By appropriately accounting for the structure of
the terms within the resulting equations, we show that the trajectory
derivatives scale linearly with the number of timesteps. Furthermore, our
approach allows for easy parallelization, significantly improved scalability
with model size, direct computation of vector-Jacobian products and improved
numerical stability compared to prior works. As an additional contribution, we
unify prior works, addressing claims that computing trajectory derivatives
using IFT scales quadratically with the number of timesteps. We evaluate our
method on a both synthetic benchmark and four challenging, learning from
demonstration benchmarks including a 6-DoF maneuvering quadrotor and 6-DoF
rocket powered landing.
- Abstract(参考訳): 本稿では,非凸,制約付き離散時間最適制御(COC)問題から生じる最適軌道を暗黙関数定理(IFT)を用いて微分する新しい手法を提案する。
従来の研究は、軌道微分のための微分カルーシュ・クーン・タッカー(KKT)システムを解き、補助線形二次レギュレータ(LQR)問題を解くことで効率よく実現している。
対照的に、(微分)kkt系におけるラグランジュ乗算項に変数除去を適用することによって生じる行列方程式を直接評価する。
結果方程式内の項の構造を適切に説明することにより、軌道微分は時間ステップの数とともに線形にスケールすることを示す。
さらに,本手法により並列化が容易になり,モデルサイズによるスケーラビリティが大幅に向上し,ベクトルジャコビアン積の直接計算が可能となった。
さらなる貢献として、IFTを用いたトラジェクトリ微分の計算は、時間ステップの数と2倍にスケールするという主張に対処する。
本手法を合成ベンチマークと4つの挑戦ベンチマークで評価し,6自由度操縦クワッドローターと6自由度ロケット動力着陸を含む実演ベンチマークから学習した。
関連論文リスト
- A Simulation-Free Deep Learning Approach to Stochastic Optimal Control [12.699529713351287]
最適制御(SOC)における一般問題の解法のためのシミュレーションフリーアルゴリズムを提案する。
既存の手法とは異なり、我々の手法は随伴問題の解を必要としない。
論文 参考訳(メタデータ) (2024-10-07T16:16:53Z) - KANtrol: A Physics-Informed Kolmogorov-Arnold Network Framework for Solving Multi-Dimensional and Fractional Optimal Control Problems [0.0]
連続時間変数を含む最適制御問題の解法として,kantrolフレームワークを導入する。
整数階数力学の正確な微分を計算するために, 自動微分がいかに利用されるかを示す。
2次元部分熱微分方程式の最適制御を含む多次元問題に取り組む。
論文 参考訳(メタデータ) (2024-09-10T17:12:37Z) - A Physics-Informed Machine Learning Approach for Solving Distributed Order Fractional Differential Equations [0.0]
本稿では,物理インフォームド機械学習フレームワークを用いた分散次分数差分方程式の解法を提案する。
分散階関数式をSVRフレームワークに組み込むことで、物理法則を直接学習プロセスに組み込む。
提案手法の有効性は,Caputo-based distributed-order fractional differential equationsの数値実験を通じて検証した。
論文 参考訳(メタデータ) (2024-09-05T13:20:10Z) - Stochastic Optimization for Non-convex Problem with Inexact Hessian
Matrix, Gradient, and Function [99.31457740916815]
信頼領域(TR)と立方体を用いた適応正則化は、非常に魅力的な理論的性質を持つことが証明されている。
TR法とARC法はヘッセン関数,勾配関数,関数値の非コンパクトな計算を同時に行うことができることを示す。
論文 参考訳(メタデータ) (2023-10-18T10:29:58Z) - An Accelerated Block Proximal Framework with Adaptive Momentum for
Nonconvex and Nonsmooth Optimization [2.323238724742687]
非平滑および非平滑最適化のための適応モーメント(ABPL$+$)を有する加速ブロック近位線形フレームワークを提案する。
いくつかのアルゴリズムでは外挿ステップの潜在的な原因を解析し、比較プロセスの強化によってこの問題を解消する。
我々はアルゴリズムを勾配ステップと線形補間ステップの更新を含む任意のシナリオに拡張する。
論文 参考訳(メタデータ) (2023-08-23T13:32:31Z) - Constrained Optimization via Exact Augmented Lagrangian and Randomized
Iterative Sketching [55.28394191394675]
等式制約付き非線形非IBS最適化問題に対する適応的不正確なニュートン法を開発した。
ベンチマーク非線形問題,LVMのデータによる制約付きロジスティック回帰,PDE制約問題において,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-28T06:33:37Z) - D4FT: A Deep Learning Approach to Kohn-Sham Density Functional Theory [79.50644650795012]
コーンシャム密度汎関数論(KS-DFT)を解くための深層学習手法を提案する。
このような手法はSCF法と同じ表現性を持つが,計算複雑性は低下する。
さらに,本手法により,より複雑なニューラルベース波動関数の探索が可能となった。
論文 参考訳(メタデータ) (2023-03-01T10:38:10Z) - Statistical Inference of Constrained Stochastic Optimization via Sketched Sequential Quadratic Programming [53.63469275932989]
制約付き非線形最適化問題のオンライン統計的推測を考察する。
これらの問題を解決するために、逐次二次計画法(StoSQP)を適用する。
論文 参考訳(メタデータ) (2022-05-27T00:34:03Z) - Numerical Solution of Stiff Ordinary Differential Equations with Random
Projection Neural Networks [0.0]
正規微分方程式(ODE)の解に対する乱射影ニューラルネットワーク(RPNN)に基づく数値スキームを提案する。
提案手法は剛性の影響を受けずに高い数値近似精度を示し,textttode45 と textttode15s の関数よりも優れていた。
論文 参考訳(メタデータ) (2021-08-03T15:49:17Z) - Cogradient Descent for Bilinear Optimization [124.45816011848096]
双線形問題に対処するために、CoGDアルゴリズム(Cogradient Descent Algorithm)を導入する。
一方の変数は、他方の変数との結合関係を考慮し、同期勾配降下をもたらす。
本アルゴリズムは,空間的制約下での1変数の問題を解くために応用される。
論文 参考訳(メタデータ) (2020-06-16T13:41:54Z) - Effective Dimension Adaptive Sketching Methods for Faster Regularized
Least-Squares Optimization [56.05635751529922]
スケッチに基づくL2正規化最小二乗問題の解法を提案する。
我々は、最も人気のあるランダム埋め込みの2つ、すなわちガウス埋め込みとサブサンプリングランダム化アダマール変換(SRHT)を考える。
論文 参考訳(メタデータ) (2020-06-10T15:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。