論文の概要: Iterative Linear Quadratic Optimization for Nonlinear Control:
Differentiable Programming Algorithmic Templates
- arxiv url: http://arxiv.org/abs/2207.06362v1
- Date: Wed, 13 Jul 2022 17:10:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 16:05:10.600218
- Title: Iterative Linear Quadratic Optimization for Nonlinear Control:
Differentiable Programming Algorithmic Templates
- Title(参考訳): 非線形制御のための反復線形二次最適化:微分プログラミングアルゴリズムテンプレート
- Authors: Vincent Roulet, Siddhartha Srinivasa, Maryam Fazel, Zaid Harchaoui
- Abstract要約: 本稿では,機能的観点からの目的の線形近似と二次近似に基づく非線形制御アルゴリズムの実装について述べる。
我々は、微分可能なプログラミングフレームワークで全てのアルゴリズムの計算複雑性を導出し、十分な最適性条件を示す。
アルゴリズムは、公開パッケージで微分可能なプログラミング言語でコード化されている。
- 参考スコア(独自算出の注目度): 9.711326718689495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the implementation of nonlinear control algorithms based on linear
and quadratic approximations of the objective from a functional viewpoint. We
present a gradient descent, a Gauss-Newton method, a Newton method,
differential dynamic programming approaches with linear quadratic or quadratic
approximations, various line-search strategies, and regularized variants of
these algorithms. We derive the computational complexities of all algorithms in
a differentiable programming framework and present sufficient optimality
conditions. We compare the algorithms on several benchmarks, such as autonomous
car racing using a bicycle model of a car. The algorithms are coded in a
differentiable programming language in a publicly available package.
- Abstract(参考訳): 本稿では,関数的視点から対象の線形および二次近似に基づく非線形制御アルゴリズムの実装について述べる。
本稿では,勾配降下法,ガウス・ニュートン法,ニュートン法,線形二次近似あるいは二次近似を用いた微分動的計画法,様々な線探索戦略,これらのアルゴリズムの正則化変種について述べる。
我々は、微分可能なプログラミングフレームワークで全てのアルゴリズムの計算複雑性を導出し、十分な最適条件を示す。
自動車の自転車モデルを用いた自動運転車レースなど,いくつかのベンチマークでアルゴリズムを比較した。
アルゴリズムは、公開パッケージで微分可能なプログラミング言語でコード化されている。
関連論文リスト
- Online Combinatorial Linear Optimization via a Frank-Wolfe-based
Metarounding Algorithm [0.589889361990138]
そこで我々は,このクラスに緩和型近似アルゴリズムが存在するという自然な仮定の下で,新しいミートアラウンドアルゴリズムを提案する。
私たちのアルゴリズムは理論的にも実用的にもはるかに効率的です。
論文 参考訳(メタデータ) (2023-10-19T10:22:03Z) - Accelerating Cutting-Plane Algorithms via Reinforcement Learning
Surrogates [49.84541884653309]
凸離散最適化問題に対する現在の標準的なアプローチは、カットプレーンアルゴリズムを使うことである。
多くの汎用カット生成アルゴリズムが存在するにもかかわらず、大規模な離散最適化問題は、難易度に悩まされ続けている。
そこで本研究では,強化学習による切削平面アルゴリズムの高速化手法を提案する。
論文 参考訳(メタデータ) (2023-07-17T20:11:56Z) - Stochastic Ratios Tracking Algorithm for Large Scale Machine Learning
Problems [0.7614628596146599]
古典的なSGDフレームワークにおける適応的なステップ長選択のための新しいアルゴリズムを提案する。
妥当な条件下では、アルゴリズムは十分に確立された理論的な要件に従ってステップ長を生成する。
このアルゴリズムは,手動チューニングから得られる最良ステップ長に匹敵するステップ長を生成することができることを示す。
論文 参考訳(メタデータ) (2023-05-17T06:22:11Z) - Online Learning Under A Separable Stochastic Approximation Framework [20.26530917721778]
分離可能な近似フレームワークを用いて,機械学習モデルのクラスに対するオンライン学習アルゴリズムを提案する。
提案アルゴリズムは,他の一般的な学習アルゴリズムと比較して,より堅牢でテスト性能が高いことを示す。
論文 参考訳(メタデータ) (2023-05-12T13:53:03Z) - Linearization Algorithms for Fully Composite Optimization [61.20539085730636]
本稿では,完全合成最適化問題を凸コンパクト集合で解くための一階アルゴリズムについて検討する。
微分可能および非微分可能を別々に扱い、滑らかな部分のみを線形化することで目的の構造を利用する。
論文 参考訳(メタデータ) (2023-02-24T18:41:48Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - Improving the Efficiency of Gradient Descent Algorithms Applied to
Optimization Problems with Dynamical Constraints [3.3722008527102894]
通常の微分方程式を用いて最適化問題を解くための2つのブロック座標降下アルゴリズムを提案する。
このアルゴリズムは損失関数勾配を評価するために直接または随伴感度解析法を実装する必要はない。
論文 参考訳(メタデータ) (2022-08-26T18:26:50Z) - Provably Faster Algorithms for Bilevel Optimization [54.83583213812667]
バイレベル最適化は多くの重要な機械学習アプリケーションに広く適用されている。
両レベル最適化のための2つの新しいアルゴリズムを提案する。
両アルゴリズムが$mathcalO(epsilon-1.5)$の複雑さを達成し,既存のアルゴリズムを桁違いに上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-08T21:05:30Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Learning Gaussian Graphical Models via Multiplicative Weights [54.252053139374205]
乗算重み更新法に基づいて,Klivans と Meka のアルゴリズムを適用した。
アルゴリズムは、文献の他のものと質的に類似したサンプル複雑性境界を楽しみます。
ランタイムが低い$O(mp2)$で、$m$サンプルと$p$ノードの場合には、簡単にオンライン形式で実装できる。
論文 参考訳(メタデータ) (2020-02-20T10:50:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。