論文の概要: History Is Not Enough: An Adaptive Dataflow System for Financial Time-Series Synthesis
- arxiv url: http://arxiv.org/abs/2601.10143v1
- Date: Thu, 15 Jan 2026 07:38:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:19.035988
- Title: History Is Not Enough: An Adaptive Dataflow System for Financial Time-Series Synthesis
- Title(参考訳): 金融時系列合成のための適応型データフローシステム
- Authors: Haochong Xia, Yao Long Teng, Regan Tan, Molei Qin, Xinrun Wang, Bo An,
- Abstract要約: は、市場とともに進化することを学ぶ適応データ生成の必要性を浮き彫りにしている。
本稿では,機械学習に基づく適応制御をデータキュレーションプロセスに統合するドリフト対応データフローシステムを提案する。
- 参考スコア(独自算出の注目度): 25.486090554711797
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In quantitative finance, the gap between training and real-world performance-driven by concept drift and distributional non-stationarity-remains a critical obstacle for building reliable data-driven systems. Models trained on static historical data often overfit, resulting in poor generalization in dynamic markets. The mantra "History Is Not Enough" underscores the need for adaptive data generation that learns to evolve with the market rather than relying solely on past observations. We present a drift-aware dataflow system that integrates machine learning-based adaptive control into the data curation process. The system couples a parameterized data manipulation module comprising single-stock transformations, multi-stock mix-ups, and curation operations, with an adaptive planner-scheduler that employs gradient-based bi-level optimization to control the system. This design unifies data augmentation, curriculum learning, and data workflow management under a single differentiable framework, enabling provenance-aware replay and continuous data quality monitoring. Extensive experiments on forecasting and reinforcement learning trading tasks demonstrate that our framework enhances model robustness and improves risk-adjusted returns. The system provides a generalizable approach to adaptive data management and learning-guided workflow automation for financial data.
- Abstract(参考訳): 定量的ファイナンスにおいて、概念ドリフトと分布非定常性によって駆動される実世界のパフォーマンスとトレーニングのギャップは、信頼できるデータ駆動システムを構築する上で重要な障害となる。
静的な歴史的データに基づいて訓練されたモデルは、しばしば過度に適合し、動的な市場での一般化が不十分になる。
マントラ "History Is Not Enough" は、過去の観察にのみ依存するのではなく、市場と共に進化することを学ぶ適応データ生成の必要性を浮き彫りにしている。
本稿では,機械学習に基づく適応制御をデータキュレーションプロセスに統合するドリフト対応データフローシステムを提案する。
このシステムは、シングルストック変換、マルチストック混合、キュレーション操作からなるパラメータ化されたデータ操作モジュールと、勾配に基づくバイレベル最適化を用いてシステムを制御する適応型プランナースケジューリングモジュールを結合する。
この設計は、データ拡張、カリキュラム学習、データワークフロー管理を単一の差別化可能なフレームワークで統一し、前向きなリプレイと継続的データ品質監視を可能にする。
予測および強化学習トレーディングタスクに関する大規模な実験は、我々のフレームワークがモデルロバスト性を高め、リスク調整されたリターンを改善することを実証している。
このシステムは、適応データ管理と学習誘導型ワークフロー自動化のための一般化可能なアプローチを提供する。
関連論文リスト
- Data Scaling Laws for End-to-End Autonomous Driving [83.85463296830743]
16時間から8192時間に及ぶ内部駆動データセット上での簡易エンド・ツー・エンド駆動アーキテクチャの性能評価を行った。
具体的には、目標の性能向上を達成するために、どの程度のトレーニングデータが必要かを調査する。
論文 参考訳(メタデータ) (2025-04-06T03:23:48Z) - FedAWA: Adaptive Optimization of Aggregation Weights in Federated Learning Using Client Vectors [50.131271229165165]
Federated Learning (FL)は、分散機械学習のための有望なフレームワークとして登場した。
ユーザの行動、好み、デバイス特性の相違から生じるデータの異質性は、連合学習にとって重要な課題である。
本稿では,学習過程におけるクライアントベクトルに基づくアダプティブ重み付けを適応的に調整する手法であるAdaptive Weight Aggregation (FedAWA)を提案する。
論文 参考訳(メタデータ) (2025-03-20T04:49:40Z) - Integrating Personalized Federated Learning with Control Systems for Enhanced Performance [0.0]
本稿では,頑健な制御システムを用いた個人化学習を支援する新しいフレームワークを提案する。
このアプローチでは,各クライアントのデータの特徴に適応するパーソナライズされたアルゴリズムを活用する。
我々の統合システムは、精度と学習速度の点で、標準のフェデレーション学習モデルよりも優れていることを実証する。
論文 参考訳(メタデータ) (2025-01-27T01:52:15Z) - A Scalable Approach to Covariate and Concept Drift Management via Adaptive Data Segmentation [0.562479170374811]
多くの現実世界のアプリケーションでは、継続的機械学習(ML)システムは不可欠だが、データドリフトが困難である。
伝統的なドリフト適応法は典型的にはアンサンブル技術を用いてモデルを更新し、しばしばドリフトされた歴史データを破棄する。
ドリフトしたデータをモデルトレーニングプロセスに明示的に組み込むことは、モデルの精度と堅牢性を大幅に向上させる、と我々は主張する。
論文 参考訳(メタデータ) (2024-11-23T17:35:23Z) - Unlearning Information Bottleneck: Machine Unlearning of Systematic Patterns and Biases [6.936871609178494]
本稿では,機械学習のプロセスを強化するための新しい情報理論フレームワークであるUnlearning Information Bottleneck(UIB)を紹介する。
変分上界を提案することにより,データ分布の変化を安価な計算コストと統合する動的事前計算により,モデルパラメータを再検討する。
さまざまなデータセット,モデル,未学習手法を対象とした実験により,本手法は学習後のモデルの性能を維持しながら,体系的なパターンやバイアスを効果的に除去することを示した。
論文 参考訳(メタデータ) (2024-05-22T21:54:05Z) - Robust Machine Learning by Transforming and Augmenting Imperfect
Training Data [6.928276018602774]
この論文は、現代の機械学習のいくつかのデータ感度を探求する。
まず、トレーニングデータで測定された事前の人間の識別をMLが符号化するのを防ぐ方法について論じる。
次に、トレーニング中に予測忠実度を提供するが、デプロイ時に信頼性が低い突発的特徴を含むデータから学習する問題について論じる。
論文 参考訳(メタデータ) (2023-12-19T20:49:28Z) - Augmented Bilinear Network for Incremental Multi-Stock Time-Series
Classification [83.23129279407271]
本稿では,有価証券のセットで事前学習したニューラルネットワークで利用可能な知識を効率的に保持する手法を提案する。
本手法では,既存の接続を固定することにより,事前学習したニューラルネットワークに符号化された事前知識を維持する。
この知識は、新しいデータを用いて最適化された一連の拡張接続によって、新しい証券に対して調整される。
論文 参考訳(メタデータ) (2022-07-23T18:54:10Z) - Adaptive Weighting Scheme for Automatic Time-Series Data Augmentation [79.47771259100674]
データ拡張のための2つのサンプル適応自動重み付けスキームを提案する。
提案手法を大規模でノイズの多い財務データセットとUCRアーカイブからの時系列データセット上で検証する。
金融データセットでは、取引戦略と組み合わせた手法が50 $%$以上の年間収益の改善につながることを示し、時系列データでは、データセットの半分以上で最新モデルを上回るパフォーマンスを発揮し、他のものと同様の精度を達成しています。
論文 参考訳(メタデータ) (2021-02-16T17:50:51Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。