論文の概要: Prediction-Enhanced Monte Carlo: A Machine Learning View on Control Variate
- arxiv url: http://arxiv.org/abs/2412.11257v3
- Date: Sat, 07 Jun 2025 13:51:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:09.608927
- Title: Prediction-Enhanced Monte Carlo: A Machine Learning View on Control Variate
- Title(参考訳): 予測強化型モンテカルロ:制御変数の機械学習ビュー
- Authors: Fengpei Li, Haoxian Chen, Jiahe Lin, Arkin Gupta, Xiaowei Tan, Honglei Zhao, Gang Xu, Yuriy Nevmyvaka, Agostino Capponi, Henry Lam,
- Abstract要約: 予測強化モンテカルロ(PEMC)は、最新のMLモデルを予測子として活用するフレームワークである。
PEMCは不偏性を維持しながらばらつきを一貫して減らし、標準モンテカルロの基準線を強力に強化する可能性を強調している。
PEMCのより広範な有効性と汎用性は、局所的なボラティリティモデルに基づく分散スワップのような株式デリバティブと、ヒース・ジャロー・モートン(HJM)金利モデルに基づく交換価格などの金利デリバティブの3つの例を通して説明する。
- 参考スコア(独自算出の注目度): 8.80905230309764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For many complex simulation tasks spanning areas such as healthcare, engineering, and finance, Monte Carlo (MC) methods are invaluable due to their unbiased estimates and precise error quantification. Nevertheless, Monte Carlo simulations often become computationally prohibitive, especially for nested, multi-level, or path-dependent evaluations lacking effective variance reduction techniques. While machine learning (ML) surrogates appear as natural alternatives, naive replacements typically introduce unquantifiable biases. We address this challenge by introducing Prediction-Enhanced Monte Carlo (PEMC), a framework that leverages modern ML models as learned predictors, using cheap and parallelizable simulation as features, to output unbiased evaluation with reduced variance and runtime. PEMC can also be viewed as a "modernized" view of control variates, where we consider the overall computation-cost-aware variance reduction instead of per-replication reduction, while bypassing the closed-form mean function requirement and maintaining the advantageous unbiasedness and uncertainty quantifiability of Monte Carlo. We illustrate PEMC's broader efficacy and versatility through three examples: first, equity derivatives such as variance swaps under stochastic local volatility models; second, interest rate derivatives such as swaption pricing under the Heath-Jarrow-Morton (HJM) interest-rate model. Finally, we showcase PEMC in a socially significant context - ambulance dispatch and hospital load balancing - where accurate mortality rate estimates are key for ethically sensitive decision-making. Across these diverse scenarios, PEMC consistently reduces variance while preserving unbiasedness, highlighting its potential as a powerful enhancement to standard Monte Carlo baselines.
- Abstract(参考訳): 医療、工学、金融など、多くの複雑なシミュレーションタスクにおいて、モンテカルロ法(MC)は不偏の見積もりと正確な誤差定量化のため、重要ではない。
それでもモンテカルロシミュレーションは計算的に禁止されることが多く、特にネスト、マルチレベル、パス依存の評価では効果的な分散還元技術が欠如している。
機械学習(ML)サロゲートは自然な代替品として現れるが、ナイーブな置換は通常、定量化できないバイアスをもたらす。
予測強化モンテカルロ(PEMC, Prediction-Enhanced Monte Carlo)は、学習した予測子として現代MLモデルを活用し、安価で並列化可能なシミュレーションを特徴として用い、分散と実行を低減した非バイアス評価を出力するフレームワークである。
PEMCは制御変数の「近代化された」ビューと見なすことができ、モンテカルロの平均関数要求を回避しつつ、モンテカルロの有利な不偏性や不確実な定量性を維持しながら、計算コストと計算コストの分散の全体的低減を検討することができる。
まず,確率的局所ボラティリティモデルに基づく分散スワップなどの株式デリバティブと,ヒース・ジャロー・モートン(HJM)利子レートモデルに基づく交換価格などの金利デリバティブの3つの例を紹介する。
最後に、PEMCを社会的に重要な文脈 - 救急隊の派遣と病院の負荷分散 - で示し、正確な死亡率の推定が倫理的に敏感な意思決定の鍵となる。
これらの多様なシナリオ全体で、PEMCは不偏性を維持しながらばらつきを一貫して減らし、標準モンテカルロのベースラインを強力に強化する可能性を強調している。
関連論文リスト
- Self-Healing Machine Learning: A Framework for Autonomous Adaptation in Real-World Environments [50.310636905746975]
実世界の機械学習システムは、基礎となるデータ生成プロセスの分散シフトによって、モデルの性能劣化に遭遇することが多い。
概念のドリフト適応のような既存のシフトへのアプローチは、その理性に依存しない性質によって制限される。
我々はこれらの制限を克服するために自己修復機械学習(SHML)を提案する。
論文 参考訳(メタデータ) (2024-10-31T20:05:51Z) - Pricing American Options using Machine Learning Algorithms [0.0]
本研究は,モンテカルロシミュレーションを用いて,機械学習アルゴリズムのアメリカ人オプションの価格設定への応用について検討する。
Black-Scholes-Mertonフレームワークのような伝統的なモデルは、しばしばアメリカの選択肢の複雑さに適切に対処できない。
モンテカルロ法とLast Square Methodを併用して機械学習を行った。
論文 参考訳(メタデータ) (2024-09-05T02:52:11Z) - Robust Uncertainty Quantification Using Conformalised Monte Carlo
Prediction [6.86690482279886]
不確実量化(UQ)手法は、予測毎のモデルの信頼性を推定する。
我々は新しい適応モンテカルロ(MC)ドロップアウト法と共形予測(CP)を組み合わせた新しいハイブリッドUQ手法であるMC-CPを紹介する。
MC-CPは、分類と回帰のベンチマークにおいて、MCドロップアウト、RAPS、CQRといった高度なUQ手法よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2023-08-18T16:07:01Z) - End-to-End Reinforcement Learning of Koopman Models for Economic Nonlinear Model Predictive Control [45.84205238554709]
本研究では, (e)NMPCの一部として最適性能を示すために, Koopman シュロゲートモデルの強化学習法を提案する。
エンドツーエンドトレーニングモデルは,(e)NMPCにおけるシステム識別を用いてトレーニングしたモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-03T10:21:53Z) - Predictable MDP Abstraction for Unsupervised Model-Based RL [93.91375268580806]
予測可能なMDP抽象化(PMA)を提案する。
元のMDPで予測モデルを訓練する代わりに、学習されたアクション空間を持つ変換MDPでモデルを訓練する。
我々はPMAを理論的に解析し、PMAが以前の教師なしモデルベースRLアプローチよりも大幅に改善することを示す。
論文 参考訳(メタデータ) (2023-02-08T07:37:51Z) - Interpretability in Safety-Critical FinancialTrading Systems [15.060749321774136]
2020年、世界で最も洗練された量子ヘッジファンドのいくつかが損失を被った。
我々は、トレーディングモデルの予測をどのように操作できるかを正確に評価するために、勾配に基づくアプローチを実装した。
提案手法では,入出力分布に大きな負のずれが生じる,サンプル内入力設定のように見えることが判明した。
論文 参考訳(メタデータ) (2021-09-24T17:05:58Z) - Blending MPC & Value Function Approximation for Efficient Reinforcement
Learning [42.429730406277315]
モデル予測制御(MPC)は、複雑な実世界のシステムを制御する強力なツールである。
モデルフリー強化学習(RL)によるMPC改善のためのフレームワークを提案する。
我々は,本手法がmpcに匹敵する性能と真のダイナミクスを両立できることを示す。
論文 参考訳(メタデータ) (2020-12-10T11:32:01Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Transfer Learning without Knowing: Reprogramming Black-box Machine
Learning Models with Scarce Data and Limited Resources [78.72922528736011]
そこで我々は,ブラックボックス・アタベラル・リプログラミング (BAR) という新しい手法を提案する。
ゼロオーダー最適化とマルチラベルマッピング技術を用いて、BARは入力出力応答のみに基づいてブラックボックスMLモデルをプログラムする。
BARは最先端の手法より優れ、バニラ対逆プログラミング法に匹敵する性能を得る。
論文 参考訳(メタデータ) (2020-07-17T01:52:34Z) - Scalable Control Variates for Monte Carlo Methods via Stochastic
Optimization [62.47170258504037]
本稿では,制御,カーネル,ニューラルネットワークを用いた既存のアプローチを包含し,一般化するフレームワークを提案する。
新たな理論的結果は、達成可能な分散還元に関する洞察を与えるために提示され、ベイズ推定への応用を含む経験的評価が支持される。
論文 参考訳(メタデータ) (2020-06-12T22:03:25Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。