論文の概要: On Parametric Optimal Execution and Machine Learning Surrogates
- arxiv url: http://arxiv.org/abs/2204.08581v3
- Date: Sun, 29 Oct 2023 07:08:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 01:39:11.513627
- Title: On Parametric Optimal Execution and Machine Learning Surrogates
- Title(参考訳): パラメトリック最適実行と機械学習サロゲートについて
- Authors: Tao Chen and Mike Ludkovski and Moritz Vo{\ss}
- Abstract要約: 本研究では,短時間の価格変動とレジリエンスを考慮した離散時間における最適順序実行問題について検討する。
動的プログラミングとディープラーニングに基づく数値アルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 3.077531983369872
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate optimal order execution problems in discrete time with
instantaneous price impact and stochastic resilience. First, in the setting of
linear transient price impact we derive a closed-form recursion for the optimal
strategy, extending the deterministic results from Obizhaeva and Wang (J
Financial Markets, 2013). Second, we develop a numerical algorithm based on
dynamic programming and deep learning for the case of nonlinear transient price
impact as proposed by Bouchaud et al. (Quant. Finance, 2004). Specifically, we
utilize an actor-critic framework that constructs two neural-network (NN)
surrogates for the value function and the feedback control. The flexible
scalability of NN functional approximators enables parametric learning, i.e.,
incorporating several model or market parameters as part of the input space.
Precise calibration of price impact, resilience, etc., is known to be extremely
challenging and hence it is critical to understand sensitivity of the execution
policy to these parameters. Our NN learner organically scales across multiple
input dimensions and is shown to accurately approximate optimal strategies
across a wide range of parameter configurations. We provide a fully
reproducible Jupyter Notebook with our NN implementation, which is of
independent pedagogical interest, demonstrating the ease of use of NN
surrogates in (parametric) stochastic control problems.
- Abstract(参考訳): 離散時間における最適順序実行問題を,瞬時価格の影響と確率的レジリエンスを用いて検討する。
まず、線形過渡的価格影響の設定において、最適戦略の閉形式的再帰を導き、Obishaeva と Wang (J Financial Markets, 2013) による決定論的結果を拡張する。
次に,bouchaudら(quant. finance, 2004)が提唱した非線形過渡価格の影響を考慮した動的計画法と深層学習に基づく数値アルゴリズムを開発した。
具体的には、価値関数とフィードバック制御のための2つのニューラルネットワーク(NN)サロゲートを構成するアクタ批判フレームワークを利用する。
NN関数近似器の柔軟なスケーラビリティによりパラメトリック学習が可能となり、入力空間の一部として複数のモデルや市場パラメータを組み込むことができる。
価格影響やレジリエンスの正確な校正は極めて困難であることが知られており、これらのパラメータに対する実行ポリシーの感度を理解することが重要である。
NN学習者は複数の入力次元にまたがって有機的にスケールし、幅広いパラメータ構成の最適戦略を正確に近似する。
本論文は, NN 実装による完全再現可能な Jupyter Notebook を提供することにより, NN サロゲートを (パラメトリック) 確率的制御問題で使用し易いことを示す。
関連論文リスト
- A Stochastic Approach to Bi-Level Optimization for Hyperparameter Optimization and Meta Learning [74.80956524812714]
我々は,現代のディープラーニングにおいて広く普及している一般的なメタ学習問題に対処する。
これらの問題は、しばしばBi-Level Optimizations (BLO)として定式化される。
我々は,与えられたBLO問題を,内部損失関数が滑らかな分布となり,外損失が内部分布に対する期待損失となるようなii最適化に変換することにより,新たな視点を導入する。
論文 参考訳(メタデータ) (2024-10-14T12:10:06Z) - Stochastic Q-learning for Large Discrete Action Spaces [79.1700188160944]
離散的な行動空間を持つ複雑な環境では、強化学習(RL)において効果的な意思決定が重要である
我々は、$n$アクションの集合全体を最適化するのとは対照的に、おそらく$mathcalO(log(n)$)$のような変数の集合のみを考える。
提示された値ベースのRL手法には、Q-learning、StochDQN、StochDDQNなどが含まれる。
論文 参考訳(メタデータ) (2024-05-16T17:58:44Z) - Active Learning with Fully Bayesian Neural Networks for Discontinuous and Nonstationary Data [0.0]
我々は,「小さなデータ」体制下でのアクティブな学習タスクに対して,完全ベイズニューラルネットワーク(FBNN)を導入する。
FBNNは信頼性の高い予測分布を提供し、アクティブな学習環境における不確実性の下で情報的意思決定に不可欠である。
そこで我々は,FBNNの「小型データ」システムにおけるアクティブな学習課題に対するNo-U-Turn Samplerを用いて,FBNNの適合性と性能を評価する。
論文 参考訳(メタデータ) (2024-05-16T05:20:47Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Dynamically configured physics-informed neural network in topology
optimization applications [4.403140515138818]
物理インフォームドニューラルネットワーク(PINN)は、前方問題を解決する際に大量のデータを生成するのを避けることができる。
動的に構成された PINN-based Topology Optimization (DCPINN-TO) 法を提案する。
変位予測と最適化結果の精度は,DCPINN-TO法が効率的かつ効率的であることを示している。
論文 参考訳(メタデータ) (2023-12-12T05:35:30Z) - Fine-Tuning Adaptive Stochastic Optimizers: Determining the Optimal Hyperparameter $ε$ via Gradient Magnitude Histogram Analysis [0.7366405857677226]
我々は、損失の大きさの経験的確率密度関数に基づく新しい枠組みを導入し、これを「緩やかな等級ヒストグラム」と呼ぶ。
そこで本稿では, 最適安全のための精密かつ高精度な探索空間を自動推定するために, 勾配等級ヒストグラムを用いた新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-11-20T04:34:19Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision
Processes [80.89852729380425]
そこで本研究では,最小限の最小残差である$tilde O(dsqrtH3K)$を計算効率よく実現したアルゴリズムを提案する。
我々の研究は線形 MDP を用いた最適 RL に対する完全な答えを提供する。
論文 参考訳(メタデータ) (2022-12-12T18:58:59Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Online Parameter Estimation for Safety-Critical Systems with Gaussian
Processes [6.122161391301866]
オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。
パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。
我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。
論文 参考訳(メタデータ) (2020-02-18T20:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。