論文の概要: Recurrent Neural Networks for Stochastic Control Problems with Delay
- arxiv url: http://arxiv.org/abs/2101.01385v1
- Date: Tue, 5 Jan 2021 07:18:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 20:38:50.087083
- Title: Recurrent Neural Networks for Stochastic Control Problems with Delay
- Title(参考訳): 遅延を伴う確率制御問題に対する繰り返しニューラルネットワーク
- Authors: Jiequn Han, Ruimeng Hu
- Abstract要約: 遅延機能を有する制御問題を解くために,ディープニューラルネットワークに基づくアルゴリズムを提案し,体系的に検討する。
具体的には,ポリシをパラメータ化し,目的関数を最適化するために,シーケンスモデリングにニューラルネットワークを用いる。
提案アルゴリズムは, 線形二乗問題, 有限遅延の最適消費, 完全メモリのポートフォリオ最適化の3つのベンチマーク例で検証した。
- 参考スコア(独自算出の注目度): 0.76146285961466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stochastic control problems with delay are challenging due to the
path-dependent feature of the system and thus its intrinsic high dimensions. In
this paper, we propose and systematically study deep neural networks-based
algorithms to solve stochastic control problems with delay features.
Specifically, we employ neural networks for sequence modeling (\emph{e.g.},
recurrent neural networks such as long short-term memory) to parameterize the
policy and optimize the objective function. The proposed algorithms are tested
on three benchmark examples: a linear-quadratic problem, optimal consumption
with fixed finite delay, and portfolio optimization with complete memory.
Particularly, we notice that the architecture of recurrent neural networks
naturally captures the path-dependent feature with much flexibility and yields
better performance with more efficient and stable training of the network
compared to feedforward networks. The superiority is even evident in the case
of portfolio optimization with complete memory, which features infinite delay.
- Abstract(参考訳): 遅延を伴う確率的制御問題は、系の経路依存的特徴と固有高次元のため困難である。
本稿では,遅延特性を持つ確率的制御問題を解くために,ディープニューラルネットワークに基づくアルゴリズムを提案し,体系的に研究する。
具体的には、シーケンスモデリングにニューラルネットワークを用いる(\emph{e.g。
ポリシーをパラメータ化し、目的関数を最適化するために、長い短期記憶のようなリカレントニューラルネットワークを使用する。
提案アルゴリズムは,線形二乗問題,有限遅延の最適消費,完全メモリのポートフォリオ最適化の3つのベンチマーク例で検証した。
特に、再帰的ニューラルネットワークのアーキテクチャは、自然に経路依存機能を柔軟に捉え、フィードフォワードネットワークよりも効率的で安定したネットワークトレーニングでより良いパフォーマンスをもたらすことに気付きます。
完全なメモリを備えたポートフォリオ最適化では、無限の遅延が特徴である。
関連論文リスト
- Improving Generalization of Deep Neural Networks by Optimum Shifting [33.092571599896814]
本稿では,ニューラルネットワークのパラメータを最小値からフラット値に変化させる,近位シフトと呼ばれる新しい手法を提案する。
本手法は,ニューラルネットワークの入力と出力が固定された場合,ネットワーク内の行列乗算を,未決定線形方程式系として扱うことができることを示す。
論文 参考訳(メタデータ) (2024-05-23T02:31:55Z) - Parallel Hyperparameter Optimization Of Spiking Neural Network [0.5371337604556311]
スパイキングニューラルネットワーク(SNN)は、通常の人工ニューラルネットワークよりも生物学的にインスパイアされたアプローチに基づいている。
我々は、サイレントネットワークと呼ぶSNNの信号損失問題に取り組む。
早期停止基準を定義することで、我々はより大きく柔軟な検索空間をインスタンス化することができた。
論文 参考訳(メタデータ) (2024-03-01T11:11:59Z) - Neural Quantile Optimization for Edge-Cloud Networking [13.509945075582447]
我々は,バースト可能な請求書に基づいて制約を満足し,コストを最小化するエッジ・クラウド・コンピューティング・ネットワークにおいて,最適なトラフィック割当方式を模索する。
本稿では,教師なし学習による最適化問題を解決するため,Gumbel-softmaxサンプリングネットワークを提案する。
トレーニングされたネットワークは、効率的なトラフィック割当スキームサンプリングとして機能し、実現可能性およびコスト関数値のランダム戦略を著しく上回る。
論文 参考訳(メタデータ) (2023-07-11T11:05:10Z) - Globally Optimal Training of Neural Networks with Threshold Activation
Functions [63.03759813952481]
しきい値アクティベートを伴うディープニューラルネットワークの重み劣化正規化学習問題について検討した。
ネットワークの特定の層でデータセットを破砕できる場合に、簡易な凸最適化の定式化を導出する。
論文 参考訳(メタデータ) (2023-03-06T18:59:13Z) - Imbedding Deep Neural Networks [0.0]
ニューラルODEのような連続深度ニューラルネットワークは、非線形ベクトル値の最適制御問題の観点から、残留ニューラルネットワークの理解を再燃させた。
本稿では,ネットワークの深さを基本変数とする新しい手法を提案する。
論文 参考訳(メタデータ) (2022-01-31T22:00:41Z) - Joint inference and input optimization in equilibrium networks [68.63726855991052]
ディープ均衡モデル(Deep equilibrium model)は、従来のネットワークの深さを予測し、代わりに単一の非線形層の固定点を見つけることによってネットワークの出力を計算するモデルのクラスである。
この2つの設定の間には自然なシナジーがあることが示されています。
この戦略は、生成モデルのトレーニングや、潜時符号の最適化、デノベートやインペインティングといった逆問題に対するトレーニングモデル、対逆トレーニング、勾配に基づくメタラーニングなど、様々なタスクにおいて実証される。
論文 参考訳(メタデータ) (2021-11-25T19:59:33Z) - Learned Optimizers for Analytic Continuation [0.0]
本稿では,凸最適化によるニューラルネットワーク手法を提案する。
トレーニングの後、学習したサロゲートは、低コストで高品質のソリューションを提供することができる。
提案手法は,大規模事前学習により,他の高次元逆問題にも容易に拡張することができる。
論文 参考訳(メタデータ) (2021-07-28T10:57:32Z) - Non-Gradient Manifold Neural Network [79.44066256794187]
ディープニューラルネットワーク(DNN)は通常、勾配降下による最適化に数千のイテレーションを要します。
非次最適化に基づく新しい多様体ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T06:39:13Z) - Short-Term Memory Optimization in Recurrent Neural Networks by
Autoencoder-based Initialization [79.42778415729475]
線形オートエンコーダを用いた列列の明示的暗記に基づく代替解を提案する。
このような事前学習が、長いシーケンスで難しい分類タスクを解くのにどのように役立つかを示す。
提案手法は, 長周期の復元誤差をはるかに小さくし, 微調整時の勾配伝播を良くすることを示す。
論文 参考訳(メタデータ) (2020-11-05T14:57:16Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Beyond Dropout: Feature Map Distortion to Regularize Deep Neural
Networks [107.77595511218429]
本稿では,ディープニューラルネットワークの中間層に関連する実験的なRademacher複雑性について検討する。
上記の問題に対処するための特徴歪み法(Disout)を提案する。
より高い試験性能を有するディープニューラルネットワークを作製するための特徴写像歪みの優位性を解析し、実証した。
論文 参考訳(メタデータ) (2020-02-23T13:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。