論文の概要: Hessian-augmented Supervised Learning for Hamilton-Jacobi-Bellman PDEs
- arxiv url: http://arxiv.org/abs/2606.23827v1
- Date: Mon, 22 Jun 2026 18:11:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.620986
- Title: Hessian-augmented Supervised Learning for Hamilton-Jacobi-Bellman PDEs
- Title(参考訳): ハミルトン・ヤコビ・ベルマンPDEのためのヘシアン補助学習
- Authors: Matías Gómez-Aedo, Behzad Azmi, Yuyang Huang, Dante Kalise, Karl Kunisch,
- Abstract要約: 非線形制御-アフィンダイナミクスを用いた決定論的最適制御問題における値関数の近似法を開発した。
ポントリャーギン原理最適性システムは、値関数の値、勾配、およびヘシアンからなるトレーニングデータを生成するために、複数の初期条件から解決される。
2次データ拡張は近似精度と閉ループ性能を向上させる。
- 参考スコア(独自算出の注目度): 4.858637148112423
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A data-driven method is developed for approximating value functions in deterministic optimal control problems with nonlinear control-affine dynamics. The Pontryagin Maximum Principle optimality system is solved from multiple initial conditions to generate training data consisting of values, gradients, and Hessians of the value function, where Hessian information is obtained from a matrix Riccati equation along optimal trajectories. These quantities augment a weighted least-squares regression over sparse polynomial bases on hyperbolic cross index sets, with gradients and Hessians contributing additional linear equations per sample and substantially reducing sample complexity compared to value-only regression. Feedback laws are recovered analytically from the learned value function. In high dimensions, a partial Hessian strategy controls the cost of data generation. The approach is validated on problems of increasing state dimension, where second-order data augmentation is shown to improve approximation accuracy and closed-loop performance, with up to an order-of-magnitude reduction in the number of training samples required relative to lower-order methods.
- Abstract(参考訳): 非線形制御-アフィンダイナミクスを用いた決定論的最適制御問題における値関数の近似法を開発した。
ポントリャーギン最大原理最適性システムは、複数の初期条件から解かれ、値関数の値、勾配、およびヘッセンからなるトレーニングデータを生成する。
これらの量は、双曲的クロスインデックス集合上のスパース多項式基底上の重み付き最小二乗回帰を増大させ、勾配とヘッセンはサンプル当たりの線形方程式を加味し、値のみの回帰と比較してサンプルの複雑さを著しく減少させる。
フィードバック法則は、学習された値関数から解析的に回収される。
高次元では、部分的なヘッセン戦略がデータ生成のコストを制御する。
提案手法は,2次データ拡張により近似精度と閉ループ性能が向上し,低次法に比較して必要なトレーニングサンプル数のオーダー・オブ・マグニチュード低減が図られる,状態次元の増大という問題に対して検証される。
関連論文リスト
- Parallel Diffusion Solver via Residual Dirichlet Policy Optimization [88.7827307535107]
拡散モデル(DM)は、最先端の生成性能を達成したが、シーケンシャルなデノナイジング特性のため、高いサンプリング遅延に悩まされている。
既存のソルバベースの加速度法では、低次元の予算で画像品質が著しく低下することが多い。
本研究では,各ステップに複数の勾配並列評価を組み込んだ新しいODE解法であるEnsemble Parallel Directionsolvr(EPD-EPr)を提案する。
論文 参考訳(メタデータ) (2025-12-28T05:48:55Z) - A Simplified Analysis of SGD for Linear Regression with Weight Averaging [64.2393952273612]
最近の研究は、定常学習率を用いた線形回帰におけるSGD最適化のためのシャープレートを提供する。
簡単な線形代数ツールを用いて,2021ベニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグナグニグニグニグニグニグニグニグニグニグニグネグニグニグニグニグネグニグニグネグニ
我々の研究は線形回帰の勾配勾配を非常に容易に解析し、ミニバッチと学習率のスケジューリングのさらなる分析に役立てることができると信じている。
論文 参考訳(メタデータ) (2025-06-18T15:10:38Z) - Differentially Private Optimization with Sparse Gradients [60.853074897282625]
微分プライベート(DP)最適化問題を個人勾配の空間性の下で検討する。
これに基づいて、スパース勾配の凸最適化にほぼ最適な速度で純粋および近似DPアルゴリズムを得る。
論文 参考訳(メタデータ) (2024-04-16T20:01:10Z) - Stochastic Gradient Descent for Gaussian Processes Done Right [86.83678041846971]
emphdone right -- 最適化とカーネルコミュニティからの具体的な洞察を使用するという意味で -- が、勾配降下は非常に効果的であることを示している。
本稿では,直感的に設計を記述し,設計選択について説明する。
本手法は,分子結合親和性予測のための最先端グラフニューラルネットワークと同程度にガウス過程の回帰を配置する。
論文 参考訳(メタデータ) (2023-10-31T16:15:13Z) - Constrained Optimization via Exact Augmented Lagrangian and Randomized
Iterative Sketching [55.28394191394675]
等式制約付き非線形非IBS最適化問題に対する適応的不正確なニュートン法を開発した。
ベンチマーク非線形問題,LVMのデータによる制約付きロジスティック回帰,PDE制約問題において,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-28T06:33:37Z) - An adaptive shortest-solution guided decimation approach to sparse
high-dimensional linear regression [2.3759847811293766]
ASSDは最短解誘導アルゴリズムから適応され、ASSDと呼ばれる。
ASSDは、実世界の応用で遭遇する高度に相関した測定行列を持つ線形回帰問題に特に適している。
論文 参考訳(メタデータ) (2022-11-28T04:29:57Z) - Rigorous dynamical mean field theory for stochastic gradient descent
methods [17.90683687731009]
一階勾配法の一家系の正確な高次元に対する閉形式方程式を証明した。
これには勾配降下(SGD)やネステロフ加速度などの広く使われているアルゴリズムが含まれる。
論文 参考訳(メタデータ) (2022-10-12T21:10:55Z) - Gradient-augmented Supervised Learning of Optimal Feedback Laws Using
State-dependent Riccati Equations [0.0]
状態依存型Riccati方程式から生成されたデータセットから安定化フィードバック法則を訓練する。
高次元非線形安定化試験は、リアルタイムの連続的大規模アルヘブラニックリカティ方程式解を適切に訓練されたフィードフォワードニューラルネットワークで置き換えることができることを実証する。
論文 参考訳(メタデータ) (2021-03-06T10:34:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。