論文の概要: Iterative Linear Quadratic Optimization for Nonlinear Control: Differentiable Programming Algorithmic Templates
- arxiv url: http://arxiv.org/abs/2207.06362v2
- Date: Sun, 06 Jul 2025 23:28:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 15:30:51.848216
- Title: Iterative Linear Quadratic Optimization for Nonlinear Control: Differentiable Programming Algorithmic Templates
- Title(参考訳): 非線形制御のための反復線形二次最適化:微分プログラミングアルゴリズムテンプレート
- Authors: Vincent Roulet, Siddhartha Srinivasa, Maryam Fazel, Zaid Harchaoui,
- Abstract要約: 反復最適化アルゴリズムは、目的関数に関する情報へのアクセスに依存する。
微分可能なプログラミングフレームワークでは、この情報を計算グラフから自動的に引き出すことができる。
非線形制御アルゴリズムは、しばしば線形近似や二次近似を用いており、この枠組みで効果的に実装できるかどうかを考察する。
- 参考スコア(独自算出の注目度): 12.012055171782073
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Iterative optimization algorithms depend on access to information about the objective function. In a differentiable programming framework, this information, such as gradients, can be automatically derived from the computational graph. We explore how nonlinear control algorithms, often employing linear and/or quadratic approximations, can be effectively cast within this framework. Our approach illuminates shared components and differences between gradient descent, Gauss-Newton, Newton, and differential dynamic programming methods in the context of discrete time nonlinear control. Furthermore, we present line-search strategies and regularized variants of these algorithms, along with a comprehensive analysis of their computational complexities. We study the performance of the aforementioned algorithms on various nonlinear control benchmarks, including autonomous car racing simulations using a simplified car model. All implementations are publicly available in a package coded in a differentiable programming language.
- Abstract(参考訳): 反復最適化アルゴリズムは、目的関数に関する情報へのアクセスに依存する。
微分可能なプログラミングフレームワークでは、勾配のようなこの情報は計算グラフから自動的に引き出すことができる。
非線形制御アルゴリズムは、しばしば線形近似や二次近似を用いており、この枠組みで効果的に実装できるかどうかを考察する。
本手法は離散時間非線形制御の文脈における共有成分と勾配降下,ガウスニュートン,ニュートン,微分動的計画法の違いを照らす。
さらに,これらのアルゴリズムの行探索戦略および正規化変種について,その計算複雑性の包括的解析を行った。
本稿では, 車両モデルを用いた自動走行シミュレーションを含む, 様々な非線形制御ベンチマークにおいて, 上記のアルゴリズムの性能について検討する。
すべての実装は、微分可能なプログラミング言語でコード化されたパッケージで公開されています。
関連論文リスト
- Online Combinatorial Linear Optimization via a Frank-Wolfe-based
Metarounding Algorithm [0.589889361990138]
そこで我々は,このクラスに緩和型近似アルゴリズムが存在するという自然な仮定の下で,新しいミートアラウンドアルゴリズムを提案する。
私たちのアルゴリズムは理論的にも実用的にもはるかに効率的です。
論文 参考訳(メタデータ) (2023-10-19T10:22:03Z) - Accelerating Cutting-Plane Algorithms via Reinforcement Learning
Surrogates [49.84541884653309]
凸離散最適化問題に対する現在の標準的なアプローチは、カットプレーンアルゴリズムを使うことである。
多くの汎用カット生成アルゴリズムが存在するにもかかわらず、大規模な離散最適化問題は、難易度に悩まされ続けている。
そこで本研究では,強化学習による切削平面アルゴリズムの高速化手法を提案する。
論文 参考訳(メタデータ) (2023-07-17T20:11:56Z) - Stochastic Ratios Tracking Algorithm for Large Scale Machine Learning
Problems [0.7614628596146599]
古典的なSGDフレームワークにおける適応的なステップ長選択のための新しいアルゴリズムを提案する。
妥当な条件下では、アルゴリズムは十分に確立された理論的な要件に従ってステップ長を生成する。
このアルゴリズムは,手動チューニングから得られる最良ステップ長に匹敵するステップ長を生成することができることを示す。
論文 参考訳(メタデータ) (2023-05-17T06:22:11Z) - Online Learning Under A Separable Stochastic Approximation Framework [20.26530917721778]
分離可能な近似フレームワークを用いて,機械学習モデルのクラスに対するオンライン学習アルゴリズムを提案する。
提案アルゴリズムは,他の一般的な学習アルゴリズムと比較して,より堅牢でテスト性能が高いことを示す。
論文 参考訳(メタデータ) (2023-05-12T13:53:03Z) - Linearization Algorithms for Fully Composite Optimization [61.20539085730636]
本稿では,完全合成最適化問題を凸コンパクト集合で解くための一階アルゴリズムについて検討する。
微分可能および非微分可能を別々に扱い、滑らかな部分のみを線形化することで目的の構造を利用する。
論文 参考訳(メタデータ) (2023-02-24T18:41:48Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - Improving the Efficiency of Gradient Descent Algorithms Applied to
Optimization Problems with Dynamical Constraints [3.3722008527102894]
通常の微分方程式を用いて最適化問題を解くための2つのブロック座標降下アルゴリズムを提案する。
このアルゴリズムは損失関数勾配を評価するために直接または随伴感度解析法を実装する必要はない。
論文 参考訳(メタデータ) (2022-08-26T18:26:50Z) - Provably Faster Algorithms for Bilevel Optimization [54.83583213812667]
バイレベル最適化は多くの重要な機械学習アプリケーションに広く適用されている。
両レベル最適化のための2つの新しいアルゴリズムを提案する。
両アルゴリズムが$mathcalO(epsilon-1.5)$の複雑さを達成し,既存のアルゴリズムを桁違いに上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-08T21:05:30Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Learning Gaussian Graphical Models via Multiplicative Weights [54.252053139374205]
乗算重み更新法に基づいて,Klivans と Meka のアルゴリズムを適用した。
アルゴリズムは、文献の他のものと質的に類似したサンプル複雑性境界を楽しみます。
ランタイムが低い$O(mp2)$で、$m$サンプルと$p$ノードの場合には、簡単にオンライン形式で実装できる。
論文 参考訳(メタデータ) (2020-02-20T10:50:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。