論文の概要: On Parametric Optimal Execution and Machine Learning Surrogates
- arxiv url: http://arxiv.org/abs/2204.08581v1
- Date: Mon, 18 Apr 2022 22:40:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 15:25:50.963508
- Title: On Parametric Optimal Execution and Machine Learning Surrogates
- Title(参考訳): パラメトリック最適実行と機械学習サロゲートについて
- Authors: Tao Chen and Mike Ludkovski and Moritz Vo{\ss}
- Abstract要約: 本稿では, 瞬時価格影響とレジリエンスによる最適実行問題について検討する。
本研究では,値関数とフィードバック制御のための2つのニューラルネットワークサロゲートを構成するアクタ批判フレームワークを開発する。
我々のパラメトリックニューラルネットワーク(NN)学習者は3-6の入力次元にわたってスケールし、正確な最適戦略を示す。
- 参考スコア(独自算出の注目度): 4.894243551960491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate optimal execution problems with instantaneous price impact and
stochastic resilience. First, in the setting of linear price impact function we
derive a closed-form recursion for the optimal strategy, generalizing previous
results with deterministic transient price impact. Second, we develop a
numerical algorithm for the case of nonlinear price impact. We utilize an
actor-critic framework that constructs two neural-network surrogates for the
value function and the feedback control. One advantage of such functional
approximators is the ability to do parametric learning, i.e. to incorporate
some of the model parameters as part of the input space. Precise calibration of
price impact, resilience, etc., is known to be extremely challenging and hence
it is critical to understand sensitivity of the strategy to these parameters.
Our parametric neural network (NN) learner organically scales across 3-6 input
dimensions and is shown to accurately approximate optimal strategy across a
range of parameter configurations. We provide a fully reproducible Jupyter
Notebook with our NN implementation, which is of independent pedagogical
interest, demonstrating the ease of use of NN surrogates in (parametric)
stochastic control problems.
- Abstract(参考訳): 即時価格影響と確率的レジリエンスを伴う最適実行問題について検討する。
まず、線形価格影響関数の設定において、最適戦略に対する閉形式再帰を導出し、決定論的過渡的価格影響で以前の結果を一般化する。
次に,非線形価格の影響を考慮した数値アルゴリズムを開発した。
我々は,値関数とフィードバック制御のための2つのニューラルネットワークサロゲートを構成するアクタ-クリティックフレームワークを利用する。
このような関数近似器の利点の1つは、パラメトリック学習、すなわちモデルパラメータのいくつかを入力空間の一部として組み込む能力である。
価格影響やレジリエンスなどの正確なキャリブレーションは非常に困難であることが知られており、これらのパラメータに対する戦略の感度を理解することが重要である。
我々のパラメトリックニューラルネットワーク(NN)学習者は3-6の入力次元を有機的にスケールし、パラメータ構成の範囲で最適な戦略を正確に近似する。
本論文は, NN 実装による完全再現可能な Jupyter Notebook を提供することにより, NN サロゲートを (パラメトリック) 確率的制御問題で使用し易いことを示す。
関連論文リスト
- A Stochastic Approach to Bi-Level Optimization for Hyperparameter Optimization and Meta Learning [74.80956524812714]
我々は,現代のディープラーニングにおいて広く普及している一般的なメタ学習問題に対処する。
これらの問題は、しばしばBi-Level Optimizations (BLO)として定式化される。
我々は,与えられたBLO問題を,内部損失関数が滑らかな分布となり,外損失が内部分布に対する期待損失となるようなii最適化に変換することにより,新たな視点を導入する。
論文 参考訳(メタデータ) (2024-10-14T12:10:06Z) - Stochastic Q-learning for Large Discrete Action Spaces [79.1700188160944]
離散的な行動空間を持つ複雑な環境では、強化学習(RL)において効果的な意思決定が重要である
我々は、$n$アクションの集合全体を最適化するのとは対照的に、おそらく$mathcalO(log(n)$)$のような変数の集合のみを考える。
提示された値ベースのRL手法には、Q-learning、StochDQN、StochDDQNなどが含まれる。
論文 参考訳(メタデータ) (2024-05-16T17:58:44Z) - Active Learning with Fully Bayesian Neural Networks for Discontinuous and Nonstationary Data [0.0]
我々は,「小さなデータ」体制下でのアクティブな学習タスクに対して,完全ベイズニューラルネットワーク(FBNN)を導入する。
FBNNは信頼性の高い予測分布を提供し、アクティブな学習環境における不確実性の下で情報的意思決定に不可欠である。
そこで我々は,FBNNの「小型データ」システムにおけるアクティブな学習課題に対するNo-U-Turn Samplerを用いて,FBNNの適合性と性能を評価する。
論文 参考訳(メタデータ) (2024-05-16T05:20:47Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Dynamically configured physics-informed neural network in topology
optimization applications [4.403140515138818]
物理インフォームドニューラルネットワーク(PINN)は、前方問題を解決する際に大量のデータを生成するのを避けることができる。
動的に構成された PINN-based Topology Optimization (DCPINN-TO) 法を提案する。
変位予測と最適化結果の精度は,DCPINN-TO法が効率的かつ効率的であることを示している。
論文 参考訳(メタデータ) (2023-12-12T05:35:30Z) - Fine-Tuning Adaptive Stochastic Optimizers: Determining the Optimal Hyperparameter $ε$ via Gradient Magnitude Histogram Analysis [0.7366405857677226]
我々は、損失の大きさの経験的確率密度関数に基づく新しい枠組みを導入し、これを「緩やかな等級ヒストグラム」と呼ぶ。
そこで本稿では, 最適安全のための精密かつ高精度な探索空間を自動推定するために, 勾配等級ヒストグラムを用いた新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-11-20T04:34:19Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision
Processes [80.89852729380425]
そこで本研究では,最小限の最小残差である$tilde O(dsqrtH3K)$を計算効率よく実現したアルゴリズムを提案する。
我々の研究は線形 MDP を用いた最適 RL に対する完全な答えを提供する。
論文 参考訳(メタデータ) (2022-12-12T18:58:59Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Online Parameter Estimation for Safety-Critical Systems with Gaussian
Processes [6.122161391301866]
オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。
パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。
我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。
論文 参考訳(メタデータ) (2020-02-18T20:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。