論文の概要: Optimal Stopping with Gaussian Processes
- arxiv url: http://arxiv.org/abs/2209.14738v1
- Date: Thu, 22 Sep 2022 21:19:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 23:05:33.274847
- Title: Optimal Stopping with Gaussian Processes
- Title(参考訳): ガウス過程による最適停止
- Authors: Kshama Dwarakanath, Danial Dervovic, Peyman Tavallali, Svitlana S
Vyetrenko, Tucker Balch
- Abstract要約: 金融時系列でよく見られる構造特性は、ガウス過程とディープガウス過程のモデルを使用することが可能であることを示す。
さらに、最適停止解析により価格モデルを伝播することにより、値関数の不確実性を定量化する。
我々のアルゴリズム群は3つの歴史的時系列データセットのベンチマークよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 2.126171264016785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel group of Gaussian Process based algorithms for fast
approximate optimal stopping of time series with specific applications to
financial markets. We show that structural properties commonly exhibited by
financial time series (e.g., the tendency to mean-revert) allow the use of
Gaussian and Deep Gaussian Process models that further enable us to
analytically evaluate optimal stopping value functions and policies. We
additionally quantify uncertainty in the value function by propagating the
price model through the optimal stopping analysis. We compare and contrast our
proposed methods against a sampling-based method, as well as a deep learning
based benchmark that is currently considered the state-of-the-art in the
literature. We show that our family of algorithms outperforms benchmarks on
three historical time series datasets that include intra-day and end-of-day
equity asset prices as well as the daily US treasury yield curve rates.
- Abstract(参考訳): 本稿では,特定用途の金融市場における時系列の最適停止を高速に近似するガウス過程に基づく新しいアルゴリズムを提案する。
金融時系列で一般に示される構造的性質(平均回帰傾向など)はガウス過程モデルや深いガウス過程モデルの利用を可能にし、最適な停止値関数や方針を解析的に評価できることを示した。
さらに, 最適停止解析により価格モデルを伝播することにより, 値関数の不確かさを定量化する。
提案手法をサンプリングベースの手法と対比し,現在文献で最先端であると考えられる深層学習ベースのベンチマークと比較した。
当社のアルゴリズム群は、日内および終末の株式資産価格を含む3つの歴史的時系列データセットと、米国の毎日の利回り曲線率のベンチマークを上回ります。
関連論文リスト
- Efficient Learning of POMDPs with Known Observation Model in Average-Reward Setting [56.92178753201331]
我々は,POMDPパラメータを信念に基づくポリシを用いて収集したサンプルから学習することのできる観測・認識スペクトル(OAS)推定手法を提案する。
提案するOAS-UCRLアルゴリズムに対して,OASプロシージャの整合性を示し,$mathcalO(sqrtT log(T)$の残差保証を証明した。
論文 参考訳(メタデータ) (2024-10-02T08:46:34Z) - Loss Shaping Constraints for Long-Term Time Series Forecasting [79.3533114027664]
本稿では,長期時系列予測のための制約付き学習手法を提案する。
提案手法は, 予測ウィンドウ上でエラーを発生させながら, 時系列ベンチマークにおける競合平均性能を示すことを示すための, 実用的なプリマル・デュアルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-14T18:20:44Z) - Rate-Optimal Policy Optimization for Linear Markov Decision Processes [65.5958446762678]
最安値の$widetilde O (sqrt K)$ regret, $K$はエピソード数を表す。
我々の研究は、バンディットフィードバックのある設定において最適な収束率(w.r.t.$K$)を確立する最初のものである。
現在、最適なレート保証を持つアルゴリズムは知られていない。
論文 参考訳(メタデータ) (2023-08-28T15:16:09Z) - $K$-Nearest-Neighbor Resampling for Off-Policy Evaluation in Stochastic
Control [0.6906005491572401]
歴史的データからポリシーの性能を推定するための,新規な$K$-nearest 隣人パラメトリック手法を提案する。
私たちの分析は、ほとんどのアプリケーションで一般的なプラクティスであるように、エピソード全体のサンプリングを可能にします。
他のOPE手法と比較して、我々のアルゴリズムは最適化を必要とせず、木に基づく近接探索と並列化によって効率的に実装することができ、環境のダイナミクスのパラメトリックモデルを明示的に仮定することはない。
論文 参考訳(メタデータ) (2023-06-07T23:55:12Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - Adversarial Robustness Guarantees for Gaussian Processes [22.403365399119107]
ガウス過程(GP)は、モデルの不確実性の原理的計算を可能にし、安全性に重要なアプリケーションに魅力的です。
境界付き摂動に対するモデル決定の不変性として定義されるGPの対向的堅牢性を分析するためのフレームワークを提案する。
我々は境界を洗練し、任意の$epsilon > 0$に対して、我々のアルゴリズムが有限個の反復で実際の値に$epsilon$-closeの値に収束することを保証していることを示す分岐とバウンドのスキームを開発する。
論文 参考訳(メタデータ) (2021-04-07T15:14:56Z) - Interpretable ML-driven Strategy for Automated Trading Pattern
Extraction [2.7910505923792646]
金融時系列分析のためのボリュームベースデータ前処理手法を提案する。
手法の性能を評価するために統計的手法を用いる。
提案手法により,金融時系列パターンの分類を成功させることができた。
論文 参考訳(メタデータ) (2021-03-23T09:55:46Z) - Sparse Algorithms for Markovian Gaussian Processes [18.999495374836584]
スパースマルコフ過程は、誘導変数の使用と効率的なカルマンフィルタライク再帰を結合する。
我々は,局所ガウス項を用いて非ガウス的確率を近似する一般的なサイトベースアプローチであるsitesを導出する。
提案手法は,変動推論,期待伝播,古典非線形カルマンスムーサなど,機械学習と信号処理の両方から得られるアルゴリズムの新たなスパース拡張の一群を導出する。
派生した方法は、モデルが時間と空間の両方で別々の誘導点を持つ文学時間データに適しています。
論文 参考訳(メタデータ) (2021-03-19T09:50:53Z) - CoinDICE: Off-Policy Confidence Interval Estimation [107.86876722777535]
強化学習における高信頼行動非依存のオフ政治評価について検討する。
様々なベンチマークにおいて、信頼区間推定が既存の手法よりも厳密で精度が高いことが示されている。
論文 参考訳(メタデータ) (2020-10-22T12:39:11Z) - Early Classification of Time Series. Cost-based Optimization Criterion
and Algorithms [0.0]
本稿では,誤分類のコストと決定を遅らせるコストの両方を考慮して,新たな最適化基準を提案する。
我々は、待ち時間とバランスを取りながら、将来期待される情報獲得を予想する非ミオピックアルゴリズムのファミリーを考案した。
論文 参考訳(メタデータ) (2020-05-20T10:08:30Z) - Time-varying Gaussian Process Bandit Optimization with Non-constant
Evaluation Time [93.6788993843846]
非定常評価時間を効果的に処理できる新しい時間変化ベイズ最適化アルゴリズムを提案する。
我々の限界は、評価時間列のパターンが問題の難易度に大きな影響を与えることを決定づける。
論文 参考訳(メタデータ) (2020-03-10T13:28:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。