論文の概要: On Parametric Optimal Execution and Machine Learning Surrogates
- arxiv url: http://arxiv.org/abs/2204.08581v1
- Date: Mon, 18 Apr 2022 22:40:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 15:25:50.963508
- Title: On Parametric Optimal Execution and Machine Learning Surrogates
- Title(参考訳): パラメトリック最適実行と機械学習サロゲートについて
- Authors: Tao Chen and Mike Ludkovski and Moritz Vo{\ss}
- Abstract要約: 本稿では, 瞬時価格影響とレジリエンスによる最適実行問題について検討する。
本研究では,値関数とフィードバック制御のための2つのニューラルネットワークサロゲートを構成するアクタ批判フレームワークを開発する。
我々のパラメトリックニューラルネットワーク(NN)学習者は3-6の入力次元にわたってスケールし、正確な最適戦略を示す。
- 参考スコア(独自算出の注目度): 4.894243551960491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate optimal execution problems with instantaneous price impact and
stochastic resilience. First, in the setting of linear price impact function we
derive a closed-form recursion for the optimal strategy, generalizing previous
results with deterministic transient price impact. Second, we develop a
numerical algorithm for the case of nonlinear price impact. We utilize an
actor-critic framework that constructs two neural-network surrogates for the
value function and the feedback control. One advantage of such functional
approximators is the ability to do parametric learning, i.e. to incorporate
some of the model parameters as part of the input space. Precise calibration of
price impact, resilience, etc., is known to be extremely challenging and hence
it is critical to understand sensitivity of the strategy to these parameters.
Our parametric neural network (NN) learner organically scales across 3-6 input
dimensions and is shown to accurately approximate optimal strategy across a
range of parameter configurations. We provide a fully reproducible Jupyter
Notebook with our NN implementation, which is of independent pedagogical
interest, demonstrating the ease of use of NN surrogates in (parametric)
stochastic control problems.
- Abstract(参考訳): 即時価格影響と確率的レジリエンスを伴う最適実行問題について検討する。
まず、線形価格影響関数の設定において、最適戦略に対する閉形式再帰を導出し、決定論的過渡的価格影響で以前の結果を一般化する。
次に,非線形価格の影響を考慮した数値アルゴリズムを開発した。
我々は,値関数とフィードバック制御のための2つのニューラルネットワークサロゲートを構成するアクタ-クリティックフレームワークを利用する。
このような関数近似器の利点の1つは、パラメトリック学習、すなわちモデルパラメータのいくつかを入力空間の一部として組み込む能力である。
価格影響やレジリエンスなどの正確なキャリブレーションは非常に困難であることが知られており、これらのパラメータに対する戦略の感度を理解することが重要である。
我々のパラメトリックニューラルネットワーク(NN)学習者は3-6の入力次元を有機的にスケールし、パラメータ構成の範囲で最適な戦略を正確に近似する。
本論文は, NN 実装による完全再現可能な Jupyter Notebook を提供することにより, NN サロゲートを (パラメトリック) 確率的制御問題で使用し易いことを示す。
関連論文リスト
- End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Dynamically configured physics-informed neural network in topology
optimization applications [4.403140515138818]
物理インフォームドニューラルネットワーク(PINN)は、前方問題を解決する際に大量のデータを生成するのを避けることができる。
動的に構成された PINN-based Topology Optimization (DCPINN-TO) 法を提案する。
変位予測と最適化結果の精度は,DCPINN-TO法が効率的かつ効率的であることを示している。
論文 参考訳(メタデータ) (2023-12-12T05:35:30Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - FAStEN: an efficient adaptive method for feature selection and
estimation in high-dimensional functional regressions [8.384075654211685]
本稿では,スパース関数オン・ファンクション回帰問題において特徴選択を行うための,新しい,柔軟な,超効率的なアプローチを提案する。
我々はそれをスカラー・オン・ファンクション・フレームワークに拡張する方法を示す。
AOMIC PIOP1による脳MRIデータへの応用について述べる。
論文 参考訳(メタデータ) (2023-03-26T19:41:17Z) - Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision
Processes [80.89852729380425]
そこで本研究では,最小限の最小残差である$tilde O(dsqrtH3K)$を計算効率よく実現したアルゴリズムを提案する。
我々の研究は線形 MDP を用いた最適 RL に対する完全な答えを提供する。
論文 参考訳(メタデータ) (2022-12-12T18:58:59Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Momentum Accelerates the Convergence of Stochastic AUPRC Maximization [80.8226518642952]
高精度リコール曲線(AUPRC)に基づく領域の最適化について検討し,不均衡なタスクに広く利用されている。
我々は、$O (1/epsilon4)$のより優れた反復による、$epsilon$定常解を見つけるための新しい運動量法を開発する。
また,O(1/epsilon4)$と同じ複雑さを持つ適応手法の新たなファミリを設計し,実際により高速な収束を享受する。
論文 参考訳(メタデータ) (2021-07-02T16:21:52Z) - Learning Regularization Parameters of Inverse Problems via Deep Neural
Networks [0.0]
ネットワークが観察データから正規化パラメータへのマッピングを近似するように訓練される、教師付き学習アプローチを検討する。
本稿では,多種多様な正規化関数,フォワードモデル,ノイズモデルについて考察する。
ネットワークが取得する正規化パラメータは、より効率的に計算でき、より正確なソリューションにもつながります。
論文 参考訳(メタデータ) (2021-04-14T02:38:38Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Online Parameter Estimation for Safety-Critical Systems with Gaussian
Processes [6.122161391301866]
オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。
パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。
我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。
論文 参考訳(メタデータ) (2020-02-18T20:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。