論文の概要: Learning the Riccati solution operator for time-varying LQR via Deep Operator Networks
- arxiv url: http://arxiv.org/abs/2604.18507v2
- Date: Tue, 21 Apr 2026 08:06:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 14:04:47.951057
- Title: Learning the Riccati solution operator for time-varying LQR via Deep Operator Networks
- Title(参考訳): 時間変化LQRに対するDeep Operator Networksを用いたRiccatiソリューション演算子学習
- Authors: Jun Chen, Umberto Biccari, Junmin Wang,
- Abstract要約: 有限水平線形二次レギュレータ(LQR)問題における微分リカティ方程式の繰り返し数値解を置き換えるための計算フレームワークを提案する。
新しいシステムインスタンスごとに非線形行列値微分方程式を解く代わりに、関連する解作用素の近似をオフラインで構築する。
得られたモデルは、広範囲のシステムにまたがる近似最適フィードバックの高速なオンライン評価を可能にする。
- 参考スコア(独自算出の注目度): 13.357666564741153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a computational framework for replacing the repeated numerical solution of differential Riccati equations in finite-horizon Linear Quadratic Regulator (LQR) problems by a learned operator surrogate. Instead of solving a nonlinear matrix-valued differential equation for each new system instance, we construct offline an approximation of the associated solution operator mapping time-dependent system parameters to the Riccati trajectory. The resulting model enables fast online evaluation of approximate optimal feedbacks across a wide class of systems, thereby shifting the computational burden from repeated numerical integration to a one-time learning stage. From a theoretical perspective, we establish control-theoretic guarantees for this operator-based approximation. In particular, we derive bounds quantifying how operator approximation errors propagate to feedback performance, trajectory accuracy, and cost suboptimality, and we prove that exponential stability of the closed-loop system is preserved under sufficiently accurate operator approximation. These results provide a framework to assess the reliability of data-driven approximations in optimal control. On the computational side, we design tailored DeepONet architectures for matrix-valued, time-dependent problems and introduce a progressive learning strategy to address scalability with respect to the system dimension. Numerical experiments on both time-invariant and time-varying LQR problems demonstrate that the proposed approach achieves high accuracy and strong generalization across a wide range of system configurations, while delivering substantial computational speedups compared to classical solvers. The method offers an effective and scalable alternative for parametric and real-time optimal control applications.
- Abstract(参考訳): 有限水平線形二次レギュレータ(LQR)問題における微分リカティ方程式の繰り返し数値解を学習演算子サロゲートで置き換える計算フレームワークを提案する。
新しいシステムインスタンスごとに非線形行列値微分方程式を解く代わりに、関連するソリューション演算子をリカティ軌道に時間依存系パラメータをマッピングする近似をオフラインで構築する。
得られたモデルにより、様々な種類のシステムにまたがる近似最適フィードバックの高速オンライン評価が可能となり、計算負荷を反復的な数値積分から1回の学習段階へとシフトさせる。
理論的な観点から、我々はこの演算子に基づく近似に対する制御理論的な保証を確立する。
特に, 演算子近似誤差がフィードバック性能, 軌道精度, コスト準最適性にどのように伝播するかを定量化し, 閉ループ系の指数的安定性が十分に正確な演算子近似の下で維持されることを示す。
これらの結果は、最適制御におけるデータ駆動近似の信頼性を評価するためのフレームワークを提供する。
計算面では,行列値の時間依存問題に対して最適化されたDeepONetアーキテクチャを設計し,システム次元に関して拡張性に対処するための漸進的な学習戦略を導入する。
時間不変および時間可変LQR問題の数値実験により,提案手法は,古典的解法と比較して計算速度の向上を図りながら,幅広いシステム構成において高い精度と強い一般化を実現することを示した。
この方法はパラメトリックおよびリアルタイム最適制御アプリケーションに対して効果的でスケーラブルな代替手段を提供する。
関連論文リスト
- Scalable Gaussian process modeling of parametrized spatio-temporal fields [2.005299372367689]
固定時間領域やパラメータ時間領域上でのパラメータ化方程式の学習のためのスケーラブルなフレームワークを開発する。
提案手法の鍵となる特徴は,後部平均と基本的に同じ計算コストで,後部分散の効率的な計算である。
結果は、特に下流タスクに不確実性推定を必要とする場合、データ駆動サロゲートモデリングの効果的なツールとして提案フレームワークを確立した。
論文 参考訳(メタデータ) (2026-02-27T20:16:21Z) - ODELoRA: Training Low-Rank Adaptation by Solving Ordinary Differential Equations [54.886931928255564]
低ランク適応(LoRA)は、深層移動学習においてパラメータ効率の高い微調整法として広く採用されている。
常微分方程式(ODE)の形でLoRA因子行列に対する新しい連続時間最適化ダイナミクスを提案する。
ODELoRAは,問題次元の異なるスケールのディープニューラルネットワークのトレーニングに不可欠な特性である,安定した特徴学習を実現する。
論文 参考訳(メタデータ) (2026-02-07T10:19:36Z) - Analyzing and Enhancing the Backward-Pass Convergence of Unrolled
Optimization [50.38518771642365]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
この設定における中心的な課題は最適化問題の解によるバックプロパゲーションであり、しばしば閉形式を欠いている。
本稿では, 非線形最適化の後方通過に関する理論的知見を提供し, 特定の反復法による線形システムの解と等価であることを示す。
Folded Optimizationと呼ばれるシステムが提案され、非ローリングなソルバ実装からより効率的なバックプロパゲーションルールを構築する。
論文 参考訳(メタデータ) (2023-12-28T23:15:18Z) - A Deep Unrolling Model with Hybrid Optimization Structure for Hyperspectral Image Deconvolution [50.13564338607482]
本稿では,DeepMixと呼ばれるハイパースペクトルデコンボリューション問題に対する新しい最適化フレームワークを提案する。
これは3つの異なるモジュール、すなわちデータ一貫性モジュール、手作りの正規化器の効果を強制するモジュール、および装飾モジュールで構成されている。
本研究は,他のモジュールの協調作業によって達成される進歩を維持するために設計された,文脈を考慮した認知型モジュールを提案する。
論文 参考訳(メタデータ) (2023-06-10T08:25:16Z) - OKRidge: Scalable Optimal k-Sparse Ridge Regression [21.17964202317435]
スパースリッジ回帰のための高速アルゴリズムOKRidgeを提案する。
また,ビームサーチを利用した解法を温める方法を提案する。
論文 参考訳(メタデータ) (2023-04-13T17:34:44Z) - Neural Solvers for Fast and Accurate Numerical Optimal Control [12.80824586913772]
本稿では,固定的な計算予算が与えられた場合,最適化された制御ポリシーの品質を向上させるための技術を提供する。
我々は、微分方程式解法とニューラルネットワークをハイブリダイズする超解法アプローチにより、上記のことを達成した。
論文 参考訳(メタデータ) (2022-03-13T10:46:50Z) - Unsupervised Reservoir Computing for Solving Ordinary Differential
Equations [1.6371837018687636]
通常の微分方程式(ODE)を満たす近似解を発見することができるエコー状態のリカレントニューラルネットワーク
ベイジアン最適化を用いて高次元ハイパーパラメータ空間における最適集合を効率よく発見し、1つの集合がロバストであり、異なる初期条件と時間範囲のODEを解くことができることを示す。
論文 参考訳(メタデータ) (2021-08-25T18:16:42Z) - Fast Distributionally Robust Learning with Variance Reduced Min-Max
Optimization [85.84019017587477]
分散的ロバストな教師付き学習は、現実世界のアプリケーションのための信頼性の高い機械学習システムを構築するための重要なパラダイムとして登場している。
Wasserstein DRSLを解くための既存のアルゴリズムは、複雑なサブプロブレムを解くか、勾配を利用するのに失敗する。
我々はmin-max最適化のレンズを通してwaserstein drslを再検討し、スケーラブルで効率的に実装可能な超勾配アルゴリズムを導出する。
論文 参考訳(メタデータ) (2021-04-27T16:56:09Z) - Non-intrusive surrogate modeling for parametrized time-dependent PDEs
using convolutional autoencoders [0.0]
パラメータ化時間依存PDEによる複雑系の予測モデリングのための機械学習に基づく非侵襲的代理モデリング手法を提案する。
我々は、畳み込みオートエンコーダをフィードフォワードニューラルネットワークと組み合わせて、問題のパラメトリック空間から解空間への低コストで正確なマッピングを確立する。
論文 参考訳(メタデータ) (2021-01-14T11:34:58Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Channel Assignment in Uplink Wireless Communication using Machine
Learning Approach [54.012791474906514]
本稿では,アップリンク無線通信システムにおけるチャネル割り当て問題について検討する。
我々の目標は、整数チャネル割り当て制約を受ける全ユーザの総和率を最大化することです。
計算複雑性が高いため、機械学習アプローチは計算効率のよい解を得るために用いられる。
論文 参考訳(メタデータ) (2020-01-12T15:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。