論文の概要: Multi-Trajectory Physics-Informed Neural Networks for HJB Equations with Hard-Zero Terminal Inventory: Optimal Execution on Synthetic & SPY Data
- arxiv url: http://arxiv.org/abs/2512.12708v1
- Date: Sun, 14 Dec 2025 14:20:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.397402
- Title: Multi-Trajectory Physics-Informed Neural Networks for HJB Equations with Hard-Zero Terminal Inventory: Optimal Execution on Synthetic & SPY Data
- Title(参考訳): ハードゼロ終端インベントリを持つHJB方程式に対するマルチトラック物理インフォームニューラルネットワーク:合成とSPYデータの最適実行
- Authors: Anthime Valin,
- Abstract要約: ハードゼロ端末在庫制約を用いた最適取引実行について検討する。
バニラPINNは、しばしばこの制約を過小評価し、不安定な制御を生成する。
本稿では,ロールアウトに基づくトラジェクトリ損失を付加し,終末ペナルティを伝搬するマルチトラジェクトリPINNを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study optimal trade execution with a hard-zero terminal inventory constraint, modeled via Hamilton-Jacobi-Bellman (HJB) equations. Vanilla PINNs often under-enforce this constraint and produce unstable controls. We propose a Multi-Trajectory PINN (MT-PINN) that adds a rollout-based trajectory loss and propagates a terminal penalty on terminal inventory via backpropagation-through-time, directly enforcing zero terminal inventory. A lightweight lambda-curriculum is adopted to stabilize training as the state expands from a risk-neutral reduced HJB to a risk-averse HJB. On the Gatheral-Schied single-asset model, MT-PINN aligns closely with their derived closed-form solutions and concentrates terminal inventory tightly around zero while reducing errors along optimal paths. We apply MT-PINNs on SPY intraday data, matching TWAP when risk-neutral, and achieving lower exposure and competitive costs, especially in falling windows, for higher risk-aversion.
- Abstract(参考訳): ハミルトン・ヤコビ・ベルマン方程式(HJB)をモデルとしたハードゼロ端末在庫制約による最適取引実行について検討した。
バニラPINNは、しばしばこの制約を過小評価し、不安定な制御を生成する。
本稿では、ロールアウトに基づく軌道損失を付加し、バックプロパゲーションスルータイムを介して端末在庫の終端ペナルティを伝播するマルチトラジェクトリPINN(MT-PINN)を提案する。
リスク中立化されたHJBからリスク逆HJBへと状態が拡大するにつれて、トレーニングを安定させるために軽量なラムダカリキュラムが採用される。
Gatheral-Schied 単座モデルでは、MT-PINN は導出した閉形式解と密接に一致し、最適経路に沿った誤差を低減しつつ、端末の在庫をゼロ付近に集中させる。
MT-PINNをSPYの日内データに適用し、リスクニュートラル時のTWAPとマッチングし、特に窓ガラスの露光や競争コストを低減し、リスク回避を図る。
関連論文リスト
- RRaPINNs: Residual Risk-Aware Physics Informed Neural Networks [0.0]
物理インフォームドニューラルネットワーク(PINN)は通常、大きな局所的なエラーを隠蔽する平均残差を最小化する。
CVaR(Residual Risk-Aware Physics-Informed Neural Networks PINNs)を提案する。
本稿では, メモリレスサンプリング, グローバルのみのテール予算, 残留中心リスクなどのフレームワークの制限について論じ, 永続的ハードポイント再生, 局所的リスク予算, およびBC/IC用語に対する多目的リスクを概説する。
論文 参考訳(メタデータ) (2025-11-23T16:10:45Z) - INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.84396402100827]
本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文 参考訳(メタデータ) (2025-11-16T20:14:28Z) - Tail-Safe Hedging: Explainable Risk-Sensitive Reinforcement Learning with a White-Box CBF--QP Safety Layer in Arbitrage-Free Markets [4.235667373386689]
Tail-Safeは、デリバティブヘッジのためのデプロイ性指向のフレームワークである。
学習コンポーネントは、IQNベースの分布批判とCVaRの目的を組み合わせる。
安全コンポーネントは、ドメイン固有の制約とともに離散時間CBF不等式を強制する。
論文 参考訳(メタデータ) (2025-10-06T07:39:45Z) - Accelerating PDE Solvers with Equation-Recast Neural Operator Preconditioning [9.178290601589365]
Minimal-Data Parametric Neural Operator Preconditioning (MD-PNOP) はパラメトリックPDEソルバを高速化するための新しいパラダイムである。
パラメータ偏差の残差を、トレーニングされたニューラル演算子を使用して、オフラインでソリューションを洗練させる、追加のソース用語として再キャストする。
固定ソース、単一グループ固有値、および多群結合固有値問題に対する完全順序忠実度を維持しつつ、計算時間の50%削減を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-01T12:14:58Z) - TT-PINN: A Tensor-Compressed Neural PDE Solver for Edge Computing [7.429526302331948]
物理インフォームドニューラルネットワーク(PINN)は、複雑な物理系をモデル化する能力のため、ますます採用されている。
本稿では,Helmholtz-Train分解に基づくエンドツーエンド圧縮PINNを提案する。
論文 参考訳(メタデータ) (2022-07-04T23:56:27Z) - Linearity Grafting: Relaxed Neuron Pruning Helps Certifiable Robustness [172.61581010141978]
証明可能な堅牢性は、安全クリティカルなシナリオでディープニューラルネットワーク(DNN)を採用する上で望ましい特性である。
線形性の適切なレベルを「グラフト」することで、神経細胞を戦略的に操作する新しいソリューションを提案する。
論文 参考訳(メタデータ) (2022-06-15T22:42:29Z) - Physics-Informed Neural Operator for Learning Partial Differential
Equations [55.406540167010014]
PINOは、演算子を学ぶために異なる解像度でデータとPDE制約を組み込んだ最初のハイブリッドアプローチである。
結果の PINO モデルは、多くの人気のある PDE ファミリの基底構造解演算子を正確に近似することができる。
論文 参考訳(メタデータ) (2021-11-06T03:41:34Z) - Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks [59.419152768018506]
最適ポリシーは必ずk-SP制約を満たすことを示す。
本研究では,SP制約に違反するポリシーを完全に排除する代わりに,新たなコスト関数を提案する。
また,MiniGrid,DeepMind Lab,Atari,Fetchを用いた実験の結果,提案手法はPPOを著しく改善することが示された。
論文 参考訳(メタデータ) (2021-07-13T21:39:21Z) - Chance-Constrained Control with Lexicographic Deep Reinforcement
Learning [77.34726150561087]
本稿では,レキシックなDeep Reinforcement Learning(DeepRL)に基づく確率制約マルコフ決定プロセスを提案する。
有名なDeepRLアルゴリズムDQNの辞書版も提案され、シミュレーションによって検証されている。
論文 参考訳(メタデータ) (2020-10-19T13:09:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。