論文の概要: Neural optimal controller for stochastic systems via pathwise HJB
operator
- arxiv url: http://arxiv.org/abs/2402.15592v1
- Date: Fri, 23 Feb 2024 20:19:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 17:48:18.670002
- Title: Neural optimal controller for stochastic systems via pathwise HJB
operator
- Title(参考訳): 経路HJB演算子を用いた確率系のニューラル最適制御
- Authors: Zhe Jiao, Xiaoyan Luo, Xinlei Yi
- Abstract要約: 本研究の目的は,物理インフォームドラーニングと動的プログラミングに基づく高次元制御問題に対するディープラーニングに基づくアルゴリズムの開発である。
我々はHJB方程式に付随するパスワイズ演算子を導入し、物理インフォームドラーニングの問題を定義する。
最適制御が明示的な表現を持つか否かに応じて,物理インフォームド学習問題の解法として2つの数値解法を提案する。
- 参考スコア(独自算出の注目度): 2.8928489670253277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The aim of this work is to develop deep learning-based algorithms for
high-dimensional stochastic control problems based on physics-informed learning
and dynamic programming. Unlike classical deep learning-based methods relying
on a probabilistic representation of the solution to the
Hamilton--Jacobi--Bellman (HJB) equation, we introduce a pathwise operator
associated with the HJB equation so that we can define a problem of
physics-informed learning. According to whether the optimal control has an
explicit representation, two numerical methods are proposed to solve the
physics-informed learning problem. We provide an error analysis on how the
truncation, approximation and optimization errors affect the accuracy of these
methods. Numerical results on various applications are presented to illustrate
the performance of the proposed algorithms.
- Abstract(参考訳): 本研究の目的は,物理学習と動的プログラミングに基づく高次元確率制御問題に対する深層学習に基づくアルゴリズムの開発である。
ハミルトン-ヤコビ-ベルマン方程式(HJB)の解の確率的表現に依存する古典的な深層学習法とは異なり、HJB方程式に付随するパスワイズ作用素を導入し、物理インフォームドラーニングの問題を定義する。
最適制御が明示的な表現を持つかどうかにより、2つの数値解法が提案されている。
提案手法では, トラルニケーション, 近似, 最適化誤差が精度に与える影響について, 誤差解析を行う。
提案アルゴリズムの性能を示すために,様々な応用の数値計算結果を示す。
関連論文リスト
- Integrating Physics-Informed Deep Learning and Numerical Methods for Robust Dynamics Discovery and Parameter Estimation [0.0]
本研究では,動的システム理論における2つの課題を解決するために,ディープラーニング手法と微分方程式の古典的数値法を組み合わせる。
その結果,カオス力学を示す一連のテスト問題に対する提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-05T22:40:02Z) - Towards Gaussian Process for operator learning: an uncertainty aware resolution independent operator learning algorithm for computational mechanics [8.528817025440746]
本稿では、パラメトリック微分方程式を解くための新しいガウス過程(GP)に基づくニューラル演算子を提案する。
ニューラル演算子を用いて学習した潜在空間でGPカーネルを定式化するニューラル演算子埋め込みカーネル'を提案する。
本研究は, 不確実性評価におけるロバスト性を維持しつつ, 複雑なPDEを解く上で, この枠組みの有効性を強調した。
論文 参考訳(メタデータ) (2024-09-17T08:12:38Z) - Hamilton-Jacobi Based Policy-Iteration via Deep Operator Learning [9.950128864603599]
我々は、DeepONetと最近開発されたポリシースキームを組み込んで、最適制御問題を数値的に解く。
ニューラルネットワークをトレーニングすると、最適制御問題とHJB方程式の解を素早く推測できる。
論文 参考訳(メタデータ) (2024-06-16T12:53:17Z) - An Optimization-based Deep Equilibrium Model for Hyperspectral Image
Deconvolution with Convergence Guarantees [71.57324258813675]
本稿では,ハイパースペクトル画像のデコンボリューション問題に対処する新しい手法を提案する。
新しい最適化問題を定式化し、学習可能な正規化器をニューラルネットワークの形で活用する。
導出した反復解法は、Deep Equilibriumフレームワーク内の不動点計算問題として表現される。
論文 参考訳(メタデータ) (2023-06-10T08:25:16Z) - A Block-Coordinate Approach of Multi-level Optimization with an
Application to Physics-Informed Neural Networks [0.0]
非線形最適化問題の解法として多レベルアルゴリズムを提案し,その評価複雑性を解析する。
物理インフォームドニューラルネットワーク (PINN) を用いた偏微分方程式の解に適用し, 提案手法がより良い解法と計算量を大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-05-23T19:12:02Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Deep Graphic FBSDEs for Opinion Dynamics Stochastic Control [27.38625075499457]
本稿では,動的・コスト関数における平均場項結合を用いた意見力学の最適制御問題の解法として,スケーラブルなディープラーニング手法を提案する。
提案したフレームワークは,超大規模問題に対する将来の応用の可能性を開く。
論文 参考訳(メタデータ) (2022-04-05T22:07:32Z) - Amortized Implicit Differentiation for Stochastic Bilevel Optimization [53.12363770169761]
決定論的条件と決定論的条件の両方において、二段階最適化問題を解決するアルゴリズムのクラスについて検討する。
厳密な勾配の推定を補正するために、ウォームスタート戦略を利用する。
このフレームワークを用いることで、これらのアルゴリズムは勾配の偏りのない推定値にアクセス可能な手法の計算複雑性と一致することを示す。
論文 参考訳(メタデータ) (2021-11-29T15:10:09Z) - ES-Based Jacobian Enables Faster Bilevel Optimization [53.675623215542515]
バイレベル最適化(BO)は多くの現代の機械学習問題を解決する強力なツールとして生まれてきた。
既存の勾配法では、ヤコビアンあるいはヘッセンベクトル計算による二階微分近似が必要となる。
本稿では,進化戦略(ES)に基づく新しいBOアルゴリズムを提案し,BOの過勾配における応答ヤコビ行列を近似する。
論文 参考訳(メタデータ) (2021-10-13T19:36:50Z) - Fractal Structure and Generalization Properties of Stochastic
Optimization Algorithms [71.62575565990502]
最適化アルゴリズムの一般化誤差は、その一般化尺度の根底にあるフラクタル構造の複雑性'にバウンドできることを示す。
さらに、特定の問題(リニア/ロジスティックレグレッション、隠れ/層ニューラルネットワークなど)とアルゴリズムに対して、結果をさらに専門化します。
論文 参考訳(メタデータ) (2021-06-09T08:05:36Z) - Logistic Q-Learning [87.00813469969167]
MDPにおける最適制御の正規化線形プログラミング定式化から導いた新しい強化学習アルゴリズムを提案する。
提案アルゴリズムの主な特徴は,広範に使用されているベルマン誤差の代わりとして理論的に音声として機能する,政策評価のための凸損失関数である。
論文 参考訳(メタデータ) (2020-10-21T17:14:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。