論文の概要: A Neural RDE approach for continuous-time non-Markovian stochastic
control problems
- arxiv url: http://arxiv.org/abs/2306.14258v1
- Date: Sun, 25 Jun 2023 14:30:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 16:05:13.551302
- Title: A Neural RDE approach for continuous-time non-Markovian stochastic
control problems
- Title(参考訳): 連続時間非マルコフ確率制御問題に対するニューラル RDE アプローチ
- Authors: Melker Hoglund, Emilio Ferrucci, Camilo Hernandez, Aitor Muguruza
Gonzalez, Cristopher Salvi, Leandro Sanchez-Betancourt, Yufei Zhang
- Abstract要約: ニューラル粗微分方程式(ニューラルRDE)を用いた連続時間非マルコフ制御問題のための新しい枠組みを提案する。
非マルコビアン性は、システム係数の時間遅延効果や駆動ノイズによる制御問題に自然に現れる。
制御過程を状態過程によって駆動されるニューラルRDEの解としてモデル化することにより,制御状態のジョイントダイナミクスが制御不能で拡張されたニューラルRDEによって制御されていることを示す。
- 参考スコア(独自算出の注目度): 4.155942878350882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel framework for solving continuous-time non-Markovian
stochastic control problems by means of neural rough differential equations
(Neural RDEs) introduced in Morrill et al. (2021). Non-Markovianity naturally
arises in control problems due to the time delay effects in the system
coefficients or the driving noises, which leads to optimal control strategies
depending explicitly on the historical trajectories of the system state. By
modelling the control process as the solution of a Neural RDE driven by the
state process, we show that the control-state joint dynamics are governed by an
uncontrolled, augmented Neural RDE, allowing for fast Monte-Carlo estimation of
the value function via trajectories simulation and memory-efficient
backpropagation. We provide theoretical underpinnings for the proposed
algorithmic framework by demonstrating that Neural RDEs serve as universal
approximators for functions of random rough paths. Exhaustive numerical
experiments on non-Markovian stochastic control problems are presented, which
reveal that the proposed framework is time-resolution-invariant and achieves
higher accuracy and better stability in irregular sampling compared to existing
RNN-based approaches.
- Abstract(参考訳): 本稿では,Morrill et al. (2021)で導入されたニューラル粗微分方程式(ニューラルRDE)を用いて,連続時間非マルコフ確率制御問題の解法を提案する。
非マルコビアン性は、システム係数の時間遅延効果や駆動ノイズによって制御問題に自然に生じ、システム状態の歴史的軌跡に明示的に依存する最適な制御戦略をもたらす。
制御過程を状態過程によって駆動される神経rdeの解としてモデル化することにより、制御状態関節のダイナミクスが制御不能な拡張ニューラルネットワークrdeによって制御され、軌道シミュレーションとメモリ効率の良いバックプロパゲーションにより、値関数の高速モンテカルロ推定を可能にする。
提案手法は,ランダムな粗い経路の関数の普遍的近似器としてニューラル rdes が機能することを示すことによって,提案手法の理論的基盤を提供する。
非マルコフ確率制御問題に対する徹底的な数値実験を行い,提案手法が時間分解不変であり,既存のrnn法と比較して不規則サンプリングの精度と安定性が向上したことを明らかにした。
関連論文リスト
- Trajectory Flow Matching with Applications to Clinical Time Series Modeling [77.58277281319253]
Trajectory Flow Matching (TFM) は、シミュレーションのない方法でニューラルSDEを訓練し、ダイナミックスを通してバックプロパゲーションをバイパスする。
絶対的性能と不確実性予測の観点から,3つの臨床時系列データセットの性能向上を実証した。
論文 参考訳(メタデータ) (2024-10-28T15:54:50Z) - A Simulation-Free Deep Learning Approach to Stochastic Optimal Control [12.699529713351287]
最適制御(SOC)における一般問題の解法のためのシミュレーションフリーアルゴリズムを提案する。
既存の手法とは異なり、我々の手法は随伴問題の解を必要としない。
論文 参考訳(メタデータ) (2024-10-07T16:16:53Z) - Neural ODEs as Feedback Policies for Nonlinear Optimal Control [1.8514606155611764]
ニューラルネットワークをパラメータ化した微分方程式として連続時間力学をモデル化するために、ニューラル常微分方程式(ニューラルODE)を用いる。
本稿では,一般非線形最適制御問題の解法としてニューラル・オードとして提案するニューラル・コントロール・ポリシーを提案する。
論文 参考訳(メタデータ) (2022-10-20T13:19:26Z) - Continuous-Time Modeling of Counterfactual Outcomes Using Neural
Controlled Differential Equations [84.42837346400151]
反現実的な結果を予測することは、パーソナライズされたヘルスケアをアンロックする可能性がある。
既存の因果推論アプローチでは、観察と治療決定の間の通常の離散時間間隔が考慮されている。
そこで本研究では,腫瘍増殖モデルに基づく制御可能なシミュレーション環境を提案する。
論文 参考訳(メタデータ) (2022-06-16T17:15:15Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - A Theoretical Overview of Neural Contraction Metrics for Learning-based
Control with Guaranteed Stability [7.963506386866862]
本稿では,最適縮尺と対応する微分リャプノフ関数のニューラルネットワークモデルを提案する。
そのイノベーションは、学習ベースの制御フレームワークに対して、正式な堅牢性を保証することである。
論文 参考訳(メタデータ) (2021-10-02T00:28:49Z) - Neural ODE Processes [64.10282200111983]
NDP(Neural ODE Process)は、Neural ODEの分布によって決定される新しいプロセスクラスである。
我々のモデルは,少数のデータポイントから低次元システムのダイナミクスを捉えることができることを示す。
論文 参考訳(メタデータ) (2021-03-23T09:32:06Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Neural Stochastic Contraction Metrics for Learning-based Control and
Estimation [13.751135823626493]
NSCMフレームワークにより、自律エージェントは最適な安定制御と推定ポリシーをリアルタイムで近似することができる。
これは、状態依存リカティ方程式、反復LQR、EKF、神経収縮など、既存の非線形制御と推定技術より優れている。
論文 参考訳(メタデータ) (2020-11-06T03:04:42Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。