Fugu-MT 論文翻訳(概要): Solving a class of stochastic optimal control problems by physics-informed neural networks

論文の概要: Solving a class of stochastic optimal control problems by physics-informed neural networks

arxiv url: http://arxiv.org/abs/2402.15592v2
Date: Fri, 20 Jun 2025 12:18:30 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-23 19:00:04.606122
Title: Solving a class of stochastic optimal control problems by physics-informed neural networks
Title（参考訳）: 物理インフォームドニューラルネットワークによる確率論的最適制御問題の解法
Authors: Zhe Jiao, Wantao Jia, Weiqiu Zhu,
Abstract要約: 本研究の目的は,ハミルトン・ヤコビ・ベルマン方程式と物理インフォームドラーニングに基づく高次元制御問題の解法を開発することである。本稿では,複数の出力を持つ分離ニューラルネットワークを用いて,フィードバック制御と値関数のパラメータ化を行う。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The aim of this work is to develop a deep learning method for solving high-dimensional stochastic control problems based on the Hamilton--Jacobi--Bellman (HJB) equation and physics-informed learning. Our approach is to parameterize the feedback control and the value function using a decoupled neural network with multiple outputs. We train this network by using a loss function with penalty terms that enforce the HJB equation along the sampled trajectories generated by the controlled system. More significantly, numerical results on various applications are carried out to demonstrate that the proposed approach is efficient and applicable.
Abstract（参考訳）: 本研究の目的は,ハミルトン-ヤコビ-ベルマン方程式と物理インフォームドラーニングに基づく高次元確率制御問題の解法を開発することである。本稿では,複数の出力を持つ分離ニューラルネットワークを用いて,フィードバック制御と値関数のパラメータ化を行う。我々は,制御系が生成したサンプル軌道に沿ってHJB方程式を強制するペナルティ項を持つ損失関数を用いて,このネットワークを訓練する。さらに, 提案手法が効率的かつ適用可能であることを示すため, 各種応用の数値計算を行った。

関連論文リスト

Neural Hamiltonian Operator [2.1756081703276]
従来の動的プログラミングの代替としてポントリャーギンの最大原理(PMP)がある。そこで本稿では,textbfNeural Hamiltonian Operator (NHO) の定義により,このような問題をディープラーニングで解くための形式的枠組みを提案する。 PMPによって規定される一貫性条件を強制するために、基礎となるネットワークをトレーニングすることで、最適なNHOを見つける方法を示す。
論文参考訳（メタデータ） (2025-07-02T02:56:49Z)
Deep Learning for Continuous-time Stochastic Control with Jumps [1.6112718683989882]
本研究では,ジャンプによる有限水平連続時間制御問題を解くためのモデルに基づくディープラーニング手法を提案する。我々は2つのニューラルネットワークを反復的に訓練する: 1つは最適ポリシーを表現するもので、もう1つは値関数を近似するものである。
論文参考訳（メタデータ） (2025-05-21T14:57:39Z)
Integrating Physics-Informed Deep Learning and Numerical Methods for Robust Dynamics Discovery and Parameter Estimation [0.0]
本研究では,動的システム理論における2つの課題を解決するために,ディープラーニング手法と微分方程式の古典的数値法を組み合わせる。その結果,カオス力学を示す一連のテスト問題に対する提案手法の有効性が示された。
論文参考訳（メタデータ） (2024-10-05T22:40:02Z)
Formally Verified Physics-Informed Neural Control Lyapunov Functions [4.2162963332651575]
制御リャプノフ関数は非線形系の安定化コントローラの設計と解析において中心的なツールである。本稿では,ニューラルネットワーク制御Lyapunov関数の物理インフォームド学習と形式検証について検討する。
論文参考訳（メタデータ） (2024-09-30T17:27:56Z)
Towards Gaussian Process for operator learning: an uncertainty aware resolution independent operator learning algorithm for computational mechanics [8.528817025440746]
本稿では、パラメトリック微分方程式を解くための新しいガウス過程(GP)に基づくニューラル演算子を提案する。ニューラル演算子を用いて学習した潜在空間でGPカーネルを定式化するニューラル演算子埋め込みカーネル'を提案する。本研究は, 不確実性評価におけるロバスト性を維持しつつ, 複雑なPDEを解く上で, この枠組みの有効性を強調した。
論文参考訳（メタデータ） (2024-09-17T08:12:38Z)
Hamilton-Jacobi Based Policy-Iteration via Deep Operator Learning [9.950128864603599]
我々は、DeepONetと最近開発されたポリシースキームを組み込んで、最適制御問題を数値的に解く。ニューラルネットワークをトレーニングすると、最適制御問題とHJB方程式の解を素早く推測できる。
論文参考訳（メタデータ） (2024-06-16T12:53:17Z)
Solving Poisson Equations using Neural Walk-on-Spheres [80.1675792181381]
高次元ポアソン方程式の効率的な解法としてニューラルウォーク・オン・スフェース(NWoS)を提案する。我々は,NWoSの精度,速度,計算コストにおける優位性を実証した。
論文参考訳（メタデータ） (2024-06-05T17:59:22Z)
Deep multitask neural networks for solving some stochastic optimal control problems [0.0]
本稿では,最適制御問題のクラスについて考察し,ニューラルネットワークを用いた効果的な解法を提案する。マルチタスクニューラルネットワークをトレーニングするために,タスク間の学習を動的にバランスさせる新しいスキームを導入する。実世界のデリバティブ価格問題に関する数値実験を通じて,本手法が最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2024-01-23T17:20:48Z)
An Optimization-based Deep Equilibrium Model for Hyperspectral Image Deconvolution with Convergence Guarantees [71.57324258813675]
本稿では,ハイパースペクトル画像のデコンボリューション問題に対処する新しい手法を提案する。新しい最適化問題を定式化し、学習可能な正規化器をニューラルネットワークの形で活用する。導出した反復解法は、Deep Equilibriumフレームワーク内の不動点計算問題として表現される。
論文参考訳（メタデータ） (2023-06-10T08:25:16Z)
A Block-Coordinate Approach of Multi-level Optimization with an Application to Physics-Informed Neural Networks [0.0]
非線形最適化問題の解法として多レベルアルゴリズムを提案し,その評価複雑性を解析する。物理インフォームドニューラルネットワーク (PINN) を用いた偏微分方程式の解に適用し, 提案手法がより良い解法と計算量を大幅に削減することを示す。
論文参考訳（メタデータ） (2023-05-23T19:12:02Z)
Representation Learning with Multi-Step Inverse Kinematics: An Efficient and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文参考訳（メタデータ） (2023-04-12T14:51:47Z)
Globally Optimal Training of Neural Networks with Threshold Activation Functions [63.03759813952481]
しきい値アクティベートを伴うディープニューラルネットワークの重み劣化正規化学習問題について検討した。ネットワークの特定の層でデータセットを破砕できる場合に、簡易な凸最適化の定式化を導出する。
論文参考訳（メタデータ） (2023-03-06T18:59:13Z)
Implicit Stochastic Gradient Descent for Training Physics-informed Neural Networks [51.92362217307946]
物理インフォームドニューラルネットワーク(PINN)は、前方および逆微分方程式問題の解法として効果的に実証されている。 PINNは、近似すべきターゲット関数が高周波またはマルチスケールの特徴を示す場合、トレーニング障害に閉じ込められる。本稿では,暗黙的勾配降下法(ISGD)を用いてPINNを訓練し,トレーニングプロセスの安定性を向上させることを提案する。
論文参考訳（メタデータ） (2023-03-03T08:17:47Z)
NeuralStagger: Accelerating Physics-constrained Neural PDE Solver with Spatial-temporal Decomposition [67.46012350241969]
本稿では,NeuralStaggerと呼ばれる一般化手法を提案する。元の学習タスクをいくつかの粗い解像度のサブタスクに分解する。本稿では,2次元および3次元流体力学シミュレーションにおけるNeuralStaggerの適用例を示す。
論文参考訳（メタデータ） (2023-02-20T19:36:52Z)
Experimental study of Neural ODE training with adaptive solver for dynamical systems modeling [72.84259710412293]
アダプティブと呼ばれるいくつかのODEソルバは、目の前の問題の複雑さに応じて評価戦略を適用することができる。本稿では,動的システムモデリングのためのブラックボックスとして適応型ソルバをシームレスに利用できない理由を示すための簡単な実験について述べる。
論文参考訳（メタデータ） (2022-11-13T17:48:04Z)
Accelerating the training of single-layer binary neural networks using the HHL quantum algorithm [58.720142291102135]
Harrow-Hassidim-Lloyd (HHL) の量子力学的実装から有用な情報が抽出可能であることを示す。しかし,本論文では,HHLの量子力学的実装から有用な情報を抽出し,古典的側面における解を見つける際の複雑性を低減することを目的としている。
論文参考訳（メタデータ） (2022-10-23T11:58:05Z)
Deep Graphic FBSDEs for Opinion Dynamics Stochastic Control [27.38625075499457]
本稿では,動的・コスト関数における平均場項結合を用いた意見力学の最適制御問題の解法として,スケーラブルなディープラーニング手法を提案する。提案したフレームワークは,超大規模問題に対する将来の応用の可能性を開く。
論文参考訳（メタデータ） (2022-04-05T22:07:32Z)
Amortized Implicit Differentiation for Stochastic Bilevel Optimization [53.12363770169761]
決定論的条件と決定論的条件の両方において、二段階最適化問題を解決するアルゴリズムのクラスについて検討する。厳密な勾配の推定を補正するために、ウォームスタート戦略を利用する。このフレームワークを用いることで、これらのアルゴリズムは勾配の偏りのない推定値にアクセス可能な手法の計算複雑性と一致することを示す。
論文参考訳（メタデータ） (2021-11-29T15:10:09Z)
ES-Based Jacobian Enables Faster Bilevel Optimization [53.675623215542515]
バイレベル最適化(BO)は多くの現代の機械学習問題を解決する強力なツールとして生まれてきた。既存の勾配法では、ヤコビアンあるいはヘッセンベクトル計算による二階微分近似が必要となる。本稿では,進化戦略(ES)に基づく新しいBOアルゴリズムを提案し,BOの過勾配における応答ヤコビ行列を近似する。
論文参考訳（メタデータ） (2021-10-13T19:36:50Z)
Fractal Structure and Generalization Properties of Stochastic Optimization Algorithms [71.62575565990502]
最適化アルゴリズムの一般化誤差は、その一般化尺度の根底にあるフラクタル構造の複雑性'にバウンドできることを示す。さらに、特定の問題(リニア/ロジスティックレグレッション、隠れ/層ニューラルネットワークなど)とアルゴリズムに対して、結果をさらに専門化します。
論文参考訳（メタデータ） (2021-06-09T08:05:36Z)
Logistic Q-Learning [87.00813469969167]
MDPにおける最適制御の正規化線形プログラミング定式化から導いた新しい強化学習アルゴリズムを提案する。提案アルゴリズムの主な特徴は,広範に使用されているベルマン誤差の代わりとして理論的に音声として機能する,政策評価のための凸損失関数である。
論文参考訳（メタデータ） (2020-10-21T17:14:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。