Fugu-MT 論文翻訳(概要): On Parametric Optimal Execution and Machine Learning Surrogates

論文の概要: On Parametric Optimal Execution and Machine Learning Surrogates

arxiv url: http://arxiv.org/abs/2204.08581v1
Date: Mon, 18 Apr 2022 22:40:14 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-20 15:25:50.963508
Title: On Parametric Optimal Execution and Machine Learning Surrogates
Title（参考訳）: パラメトリック最適実行と機械学習サロゲートについて
Authors: Tao Chen and Mike Ludkovski and Moritz Vo{\ss}
Abstract要約: 本稿では, 瞬時価格影響とレジリエンスによる最適実行問題について検討する。本研究では,値関数とフィードバック制御のための2つのニューラルネットワークサロゲートを構成するアクタ批判フレームワークを開発する。我々のパラメトリックニューラルネットワーク(NN)学習者は3-6の入力次元にわたってスケールし、正確な最適戦略を示す。
参考スコア（独自算出の注目度）: 4.894243551960491
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We investigate optimal execution problems with instantaneous price impact and stochastic resilience. First, in the setting of linear price impact function we derive a closed-form recursion for the optimal strategy, generalizing previous results with deterministic transient price impact. Second, we develop a numerical algorithm for the case of nonlinear price impact. We utilize an actor-critic framework that constructs two neural-network surrogates for the value function and the feedback control. One advantage of such functional approximators is the ability to do parametric learning, i.e. to incorporate some of the model parameters as part of the input space. Precise calibration of price impact, resilience, etc., is known to be extremely challenging and hence it is critical to understand sensitivity of the strategy to these parameters. Our parametric neural network (NN) learner organically scales across 3-6 input dimensions and is shown to accurately approximate optimal strategy across a range of parameter configurations. We provide a fully reproducible Jupyter Notebook with our NN implementation, which is of independent pedagogical interest, demonstrating the ease of use of NN surrogates in (parametric) stochastic control problems.
Abstract（参考訳）: 即時価格影響と確率的レジリエンスを伴う最適実行問題について検討する。まず、線形価格影響関数の設定において、最適戦略に対する閉形式再帰を導出し、決定論的過渡的価格影響で以前の結果を一般化する。次に,非線形価格の影響を考慮した数値アルゴリズムを開発した。我々は,値関数とフィードバック制御のための2つのニューラルネットワークサロゲートを構成するアクタ-クリティックフレームワークを利用する。このような関数近似器の利点の1つは、パラメトリック学習、すなわちモデルパラメータのいくつかを入力空間の一部として組み込む能力である。価格影響やレジリエンスなどの正確なキャリブレーションは非常に困難であることが知られており、これらのパラメータに対する戦略の感度を理解することが重要である。我々のパラメトリックニューラルネットワーク(NN)学習者は3-6の入力次元を有機的にスケールし、パラメータ構成の範囲で最適な戦略を正確に近似する。本論文は, NN 実装による完全再現可能な Jupyter Notebook を提供することにより, NN サロゲートを (パラメトリック) 確率的制御問題で使用し易いことを示す。

関連論文リスト

Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。非滑らかな正規化はしばしば機械学習タスクに組み込まれる。本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-04-17T08:32:25Z)
A Guaranteed-Stable Neural Network Approach for Optimal Control of Nonlinear Systems [3.5000297213981653]
非線形システムの最適制御に対する有望なアプローチは、システムを反復線形化し、最適制御入力を決定するために各タイミングで最適化問題を解くことである。このアプローチはオンライン最適化に依存するため、計算コストがかかるため、限られた計算資源を持つシステムでは非現実的である。この問題の潜在的な解決策の1つは、ニューラルネットワーク(NN)を制御ループに組み込むことである。
論文参考訳（メタデータ） (2025-01-28T22:55:47Z)
HypeRL: Parameter-Informed Reinforcement Learning for Parametric PDEs [0.6249768559720122]
我々はPDEの最適制御のための新しい汎用強化学習戦略を考案する。 HypeRLは最適制御ポリシーを直接近似することを目的としている。提案手法を2つのPDE制約付き最適制御ベンチマークで検証する。
論文参考訳（メタデータ） (2025-01-08T14:38:03Z)
A Stochastic Approach to Bi-Level Optimization for Hyperparameter Optimization and Meta Learning [74.80956524812714]
我々は,現代のディープラーニングにおいて広く普及している一般的なメタ学習問題に対処する。これらの問題は、しばしばBi-Level Optimizations (BLO)として定式化される。我々は,与えられたBLO問題を,内部損失関数が滑らかな分布となり,外損失が内部分布に対する期待損失となるようなii最適化に変換することにより,新たな視点を導入する。
論文参考訳（メタデータ） (2024-10-14T12:10:06Z)
Step-by-Step Unmasking for Parameter-Efficient Fine-tuning of Large Language Models [18.877891285367216]
我々はパラメータの重要度を連続的に計算する新しい選択型PEFT法である$textID3$を紹介した。解析的に、$textID3$は勾配更新数を2倍に減らし、計算効率が向上することを示した。
論文参考訳（メタデータ） (2024-08-26T17:58:53Z)
Stochastic Q-learning for Large Discrete Action Spaces [79.1700188160944]
離散的な行動空間を持つ複雑な環境では、強化学習(RL)において効果的な意思決定が重要である我々は、$n$アクションの集合全体を最適化するのとは対照的に、おそらく$mathcalO(log(n)$)$のような変数の集合のみを考える。提示された値ベースのRL手法には、Q-learning、StochDQN、StochDDQNなどが含まれる。
論文参考訳（メタデータ） (2024-05-16T17:58:44Z)
Active Learning with Fully Bayesian Neural Networks for Discontinuous and Nonstationary Data [0.0]
我々は,「小さなデータ」体制下でのアクティブな学習タスクに対して,完全ベイズニューラルネットワーク(FBNN)を導入する。 FBNNは信頼性の高い予測分布を提供し、アクティブな学習環境における不確実性の下で情報的意思決定に不可欠である。そこで我々は,FBNNの「小型データ」システムにおけるアクティブな学習課題に対するNo-U-Turn Samplerを用いて,FBNNの適合性と性能を評価する。
論文参考訳（メタデータ） (2024-05-16T05:20:47Z)
End-to-End Learning for Fair Multiobjective Optimization Under Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文参考訳（メタデータ） (2024-02-12T16:33:35Z)
Dynamically configured physics-informed neural network in topology optimization applications [4.403140515138818]
物理インフォームドニューラルネットワーク(PINN)は、前方問題を解決する際に大量のデータを生成するのを避けることができる。動的に構成された PINN-based Topology Optimization (DCPINN-TO) 法を提案する。変位予測と最適化結果の精度は,DCPINN-TO法が効率的かつ効率的であることを示している。
論文参考訳（メタデータ） (2023-12-12T05:35:30Z)
Fine-Tuning Adaptive Stochastic Optimizers: Determining the Optimal Hyperparameter $ε$ via Gradient Magnitude Histogram Analysis [0.7366405857677226]
我々は、損失の大きさの経験的確率密度関数に基づく新しい枠組みを導入し、これを「緩やかな等級ヒストグラム」と呼ぶ。そこで本稿では, 最適安全のための精密かつ高精度な探索空間を自動推定するために, 勾配等級ヒストグラムを用いた新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-11-20T04:34:19Z)
Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文参考訳（メタデータ） (2023-10-07T15:07:10Z)
Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision Processes [80.89852729380425]
そこで本研究では,最小限の最小残差である$tilde O(dsqrtH3K)$を計算効率よく実現したアルゴリズムを提案する。我々の研究は線形 MDP を用いた最適 RL に対する完全な答えを提供する。
論文参考訳（メタデータ） (2022-12-12T18:58:59Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)
Online Parameter Estimation for Safety-Critical Systems with Gaussian Processes [6.122161391301866]
オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。
論文参考訳（メタデータ） (2020-02-18T20:38:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。