論文の概要: Microstructure-Empowered Stock Factor Extraction and Utilization
- arxiv url: http://arxiv.org/abs/2308.08135v1
- Date: Wed, 16 Aug 2023 03:56:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-17 15:05:17.036489
- Title: Microstructure-Empowered Stock Factor Extraction and Utilization
- Title(参考訳): 微細構造を利用したストックファクターの抽出と利用
- Authors: Xianfeng Jiao, Zizhong Li, Chang Xu, Yang Liu, Weiqing Liu and Jiang
Bian
- Abstract要約: 本稿では,下流タスクの順序流データから重要な要素を抽出することを目的とした,新しいフレームワークを提案する。
このフレームワークは、さまざまなシナリオにわたる1年間のストックオーダーフローデータを効率的に処理する。
本手法は,注文フローデータから優れた因子を抽出し,株価トレンド予測や注文実行タスクの大幅な改善を実現する。
- 参考スコア(独自算出の注目度): 28.978807427453262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-frequency quantitative investment is a crucial aspect of stock
investment. Notably, order flow data plays a critical role as it provides the
most detailed level of information among high-frequency trading data, including
comprehensive data from the order book and transaction records at the tick
level. The order flow data is extremely valuable for market analysis as it
equips traders with essential insights for making informed decisions. However,
extracting and effectively utilizing order flow data present challenges due to
the large volume of data involved and the limitations of traditional factor
mining techniques, which are primarily designed for coarser-level stock data.
To address these challenges, we propose a novel framework that aims to
effectively extract essential factors from order flow data for diverse
downstream tasks across different granularities and scenarios. Our method
consists of a Context Encoder and an Factor Extractor. The Context Encoder
learns an embedding for the current order flow data segment's context by
considering both the expected and actual market state. In addition, the Factor
Extractor uses unsupervised learning methods to select such important signals
that are most distinct from the majority within the given context. The
extracted factors are then utilized for downstream tasks. In empirical studies,
our proposed framework efficiently handles an entire year of stock order flow
data across diverse scenarios, offering a broader range of applications
compared to existing tick-level approaches that are limited to only a few days
of stock data. We demonstrate that our method extracts superior factors from
order flow data, enabling significant improvement for stock trend prediction
and order execution tasks at the second and minute level.
- Abstract(参考訳): 高周波量的投資は株式投資の重要な側面である。
特に、注文書からの包括的データやティックレベルでの取引記録など、高周波取引データの中で最も詳細な情報を提供するため、注文フローデータが重要な役割を果たす。
注文フローデータは、トレーダーにインフォームド意思決定に不可欠な洞察を与えるため、市場分析に非常に有用である。
しかし, オーダーフローデータの抽出と有効利用は, 大量のデータと, 主に粗度ストックデータを対象とした従来のファクタマイニング手法の限界により, 課題となっている。
これらの課題に対処するため,我々は,様々な粒度やシナリオにわたる下流タスクの注文フローデータから不可欠な要素を効果的に抽出することを目的とした新しいフレームワークを提案する。
本手法はコンテキストエンコーダと因子エクストラクタから構成される。
Context Encoderは、期待と実際の市場状態の両方を考慮して、現在の順序フローデータセグメントのコンテキストへの埋め込みを学習する。
さらに、因子抽出器は教師なしの学習手法を使用して、与えられたコンテキスト内の多数派とは最も異なる重要なシグナルを選択する。
抽出された因子は下流のタスクに使用される。
実証研究において,提案フレームワークは,様々なシナリオにわたる在庫フローの全年を効率的に処理し,数日間の在庫データに制限された既存のダニレベルのアプローチと比較して,幅広い範囲のアプリケーションを提供する。
本手法は,注文フローデータから優れた因子を抽出し,株価傾向予測と注文実行タスクを2分単位で大幅に改善できることを実証する。
関連論文リスト
- Capturing the Temporal Dependence of Training Data Influence [100.91355498124527]
我々は、訓練中にデータポイントを除去する影響を定量化する、軌跡特異的な離脱の影響の概念を定式化する。
軌道固有LOOの効率的な近似を可能にする新しい手法であるデータ値埋め込みを提案する。
データバリューの埋め込みは、トレーニングデータの順序付けをキャプチャするので、モデルトレーニングのダイナミクスに関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2024-12-12T18:28:55Z) - STORM: A Spatio-Temporal Factor Model Based on Dual Vector Quantized Variational Autoencoders for Financial Trading [55.02735046724146]
金融取引では、ファクターモデルが資産の価格設定や過大なリターンの獲得に広く利用されている。
双対ベクトル量子化変分オートエンコーダを用いた時空間ファクトラーモデルSTORMを提案する。
ストームは時間的および空間的な視点からストックの特徴を抽出し、これらの特徴を微細で意味的なレベルで融合し整列させ、その要素を多次元の埋め込みとして表現する。
論文 参考訳(メタデータ) (2024-12-12T17:15:49Z) - BaichuanSEED: Sharing the Potential of ExtensivE Data Collection and Deduplication by Introducing a Competitive Large Language Model Baseline [34.518474035662905]
LLM(Large Language Models)の一般的な能力は、いくつかの機関によって商業秘密として扱われる広範な事前訓練データセットに大きく依存している。
我々は、その有効性と可能性を検証するために、普遍的に適用可能なデータ処理パイプラインの詳細をオープンソース化する。
BaichuanSEEDはトレーニングを通じて一貫性と予測可能性を示し、包括的なベンチマークで同等のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T14:08:23Z) - A Bargaining-based Approach for Feature Trading in Vertical Federated
Learning [54.51890573369637]
本稿では,垂直的フェデレートラーニング(VFL)において,経済的に効率的な取引を促進するための交渉型特徴取引手法を提案する。
当社のモデルでは,収益ベース最適化の目的を考慮し,パフォーマンスゲインベースの価格設定を取り入れている。
論文 参考訳(メタデータ) (2024-02-23T10:21:07Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - A Comprehensive Survey of Deep Transfer Learning for Anomaly Detection
in Industrial Time Series: Methods, Applications, and Directions [5.759456719890725]
産業プロセスの監視は、効率を高め、品質を最適化する可能性がある。
ディープラーニングは、大規模なデータセット内の非自明なパターンを識別する能力を持つため、このプロセスにおいて重要な役割を果たす。
わずかに異なるケースごとに、標準的なディープラーニングトレーニングのための大規模ラベル付きデータを取得することは不可能である。
深層移動学習はこの問題に対する解決策を提供する。
論文 参考訳(メタデータ) (2023-07-11T09:37:52Z) - Optimal transfer protocol by incremental layer defrosting [66.76153955485584]
トランスファーラーニングは、限られた量のデータでモデルトレーニングを可能にする強力なツールである。
最も単純な転送学習プロトコルは、データリッチなソースタスクで事前訓練されたネットワークの機能抽出層を凍結する。
このプロトコルは、しばしば準最適であり、事前学習されたネットワークの小さな部分を凍結したままにしておくと、最大の性能向上が達成される可能性がある。
論文 参考訳(メタデータ) (2023-03-02T17:32:11Z) - Mining Drifting Data Streams on a Budget: Combining Active Learning with
Self-Labeling [6.436899373275926]
本稿では,アクティブラーニングと自己ラベルによる情報を組み合わせることで,ドリフトするデータストリームを予算でマイニングする新しいフレームワークを提案する。
我々は,概念ドリフトの可能性を考慮して,インテリジェントなインスタンス選択と半教師付き手順の両方を活用できる戦略をいくつか導入する。
論文 参考訳(メタデータ) (2021-12-21T07:19:35Z) - Deep Reinforcement Learning for Active High Frequency Trading [1.6874375111244329]
我々は、株式市場におけるアクティブな高周波取引のための、最初のエンドツーエンドのDeep Reinforcement Learning(DRL)ベースのフレームワークを紹介する。
我々はDRLエージェントを訓練し、Pximal Policy Optimizationアルゴリズムを用いてIntel Corporation株の1ユニットを取引する。
論文 参考訳(メタデータ) (2021-01-18T15:09:28Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。