論文の概要: DSLOB: A Synthetic Limit Order Book Dataset for Benchmarking Forecasting
Algorithms under Distributional Shift
- arxiv url: http://arxiv.org/abs/2211.11513v1
- Date: Thu, 17 Nov 2022 06:33:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 19:13:17.310047
- Title: DSLOB: A Synthetic Limit Order Book Dataset for Benchmarking Forecasting
Algorithms under Distributional Shift
- Title(参考訳): DSLOB:分散シフト下での予測アルゴリズムのベンチマークのための合成極限順序ブックデータセット
- Authors: Defu Cao, Yousef El-Laham, Loc Trinh, Svitlana Vyetrenko, Yan Liu
- Abstract要約: 電子取引市場において、リミットオーダーブック(LOB)は、所定のセキュリティのための様々な価格レベルで、保留中の購入/販売注文に関する情報を提供する。
近年、下流機械学習タスクの解決にLOBデータを使うことへの関心が高まっている。
- 参考スコア(独自算出の注目度): 16.326002979578686
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In electronic trading markets, limit order books (LOBs) provide information
about pending buy/sell orders at various price levels for a given security.
Recently, there has been a growing interest in using LOB data for resolving
downstream machine learning tasks (e.g., forecasting). However, dealing with
out-of-distribution (OOD) LOB data is challenging since distributional shifts
are unlabeled in current publicly available LOB datasets. Therefore, it is
critical to build a synthetic LOB dataset with labeled OOD samples serving as a
testbed for developing models that generalize well to unseen scenarios. In this
work, we utilize a multi-agent market simulator to build a synthetic LOB
dataset, named DSLOB, with and without market stress scenarios, which allows
for the design of controlled distributional shift benchmarking. Using the
proposed synthetic dataset, we provide a holistic analysis on the forecasting
performance of three different state-of-the-art forecasting methods. Our
results reflect the need for increased researcher efforts to develop algorithms
with robustness to distributional shifts in high-frequency time series data.
- Abstract(参考訳): 電子取引市場において、リミットオーダーブック(LOB)は、所定のセキュリティのための様々な価格レベルで、保留中の購入/販売注文に関する情報を提供する。
近年、下流機械学習タスク(例えば予測)の解決にLOBデータを使うことへの関心が高まっている。
しかし、現在公開されているLOBデータセットに分散シフトがラベル付けされていないため、OODデータの扱いは困難である。
したがって、ラベル付きOODサンプルを用いた合成LOBデータセットの構築は、目に見えないシナリオをうまく一般化するモデルを開発するためのテストベッドとして重要である。
本研究では、マルチエージェント市場シミュレータを用いて、制御された分散シフトベンチマークの設計を可能にする、市場ストレスシナリオのない合成LOBデータセット(DSLOB)を構築する。
提案する合成データセットを用いて,3種類の最先端予測手法の予測性能を総合的に解析する。
この結果から,高周波時系列データの分布シフトにロバストなアルゴリズム開発の必要性が示唆された。
関連論文リスト
- F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - How Much Data are Enough? Investigating Dataset Requirements for Patch-Based Brain MRI Segmentation Tasks [74.21484375019334]
ディープニューラルネットワークを確実にトレーニングするには、大規模なデータセットへのアクセスが必要である。
モデル開発に関連する時間的・経済的コストを緩和するためには,満足度の高いモデルをトレーニングするために必要なデータの量を明確に理解することが重要である。
本稿では,パッチベースのセグメンテーションネットワークのトレーニングに必要なアノテートデータの量を推定するための戦略的枠組みを提案する。
論文 参考訳(メタデータ) (2024-04-04T13:55:06Z) - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation [83.30006900263744]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。
LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。
我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文 参考訳(メタデータ) (2024-03-04T22:47:58Z) - Generative AI for End-to-End Limit Order Book Modelling: A Token-Level
Autoregressive Generative Model of Message Flow Using a Deep State Space
Network [7.54290390842336]
本稿では,トークン化制限順序帳(LOB)メッセージを生成するエンドツーエンドの自動回帰生成モデルを提案する。
NASDAQ の株式 LOB を用いて、メッセージデータのためのカスタムトークン化器を開発し、逐次桁の群をトークンに変換する。
結果は,低モデルパープレキシティによって証明されたように,データの分布を近似する上で有望な性能を示す。
論文 参考訳(メタデータ) (2023-08-23T09:37:22Z) - Approaching sales forecasting using recurrent neural networks and
transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。
実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。
提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文 参考訳(メタデータ) (2022-04-16T12:03:52Z) - The Limit Order Book Recreation Model (LOBRM): An Extended Analysis [2.0305676256390934]
マイクロ構造秩序書(LOB)は、金融資産の細かな先進需要と供給関係を描いている。
LOBRMは最近、貿易と引用(TAQ)データからLOBを合成することで、このギャップを埋めることを提案した。
我々はLOBRMの研究を拡張し、実世界のアプリケーションシナリオでの利用をさらに検証する。
論文 参考訳(メタデータ) (2021-07-01T15:25:21Z) - The LOB Recreation Model: Predicting the Limit Order Book from TAQ
History Using an Ordinary Differential Equation Recurrent Neural Network [9.686252465354274]
LOBレクリエーションモデルは,小額株の公開制限注文書(LOB)のトップ5価格レベルを再現するための,ディープラーニングの観点からの最初の試みである。
トランスファーラーニングのパラダイムにより、同じクラスの他の金融資産に適用できるように、ある株式で訓練されたソースモデルを微調整することができる。
論文 参考訳(メタデータ) (2021-03-02T12:07:43Z) - Deep Learning for Market by Order Data [7.274325784456261]
注文による市場(MBO)データは、取引所で与えられた株式の個々の取引指示の詳細なフィードです。
MBOデータは、主にリミットオーダーブック(LOB)に焦点を当てた現在の学術文献によって無視されます。
データ構造を慎重に紹介し、特定の正規化スキームを提示することにより、MBOデータに関する最初の予測分析を提供します。
MBO駆動モデルとLOB駆動モデルはそれぞれ同様の性能を提供するが、両者のアンサンブルは予測精度の向上につながる可能性がある。
論文 参考訳(メタデータ) (2021-02-17T15:16:26Z) - BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文 参考訳(メタデータ) (2020-08-11T17:04:47Z) - Generating Realistic Stock Market Order Streams [18.86755130031027]
本稿では,GAN(Generative Adversarial Network)に基づいて,現実的で高忠実な株式市場データを生成する手法を提案する。
我々のストック-GANモデルは、注文の履歴依存を捉えるために条件付きワッサースタインGANを使用している。
論文 参考訳(メタデータ) (2020-06-07T17:32:42Z) - Low-Budget Label Query through Domain Alignment Enforcement [48.06803561387064]
我々は低予算ラベルクエリと呼ばれる新しい問題に取り組む。
まず、ソースとターゲットドメインの整合性を改善するために、Unsupervised Domain Adaptation (UDA) 法を改善します。
そこで我々は,予測整合分布の均一サンプリングに基づく簡易かつ効果的な選択法を提案する。
論文 参考訳(メタデータ) (2020-01-01T16:52:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。