論文の概要: Fiaingen: A financial time series generative method matching real-world data quality
- arxiv url: http://arxiv.org/abs/2510.01169v1
- Date: Wed, 01 Oct 2025 17:55:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.706844
- Title: Fiaingen: A financial time series generative method matching real-world data quality
- Title(参考訳): Fiaingen: 実世界のデータ品質に適合する財務時系列生成手法
- Authors: Jože M. Rožanec, Tina Žezlin, Laurentiu Vasiliu, Dunja Mladenić, Radu Prodan, Dumitru Roman,
- Abstract要約: 時系列データ生成のための新しいテクニックのセットを紹介する(Fiaingenと名づける)。
a)次元空間を縮小した実世界のデータと合成データの重複、(b)下流機械学習タスクにおけるパフォーマンス、(c)実行時のパフォーマンスの3つの基準でそれらの性能を評価する。
実験により, 上述の3つの基準にまたがって, 最先端の性能を達成できることが実証された。
- 参考スコア(独自算出の注目度): 2.333354880278056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data is vital in enabling machine learning models to advance research and practical applications in finance, where accurate and robust models are essential for investment and trading decision-making. However, real-world data is limited despite its quantity, quality, and variety. The data shortage of various financial assets directly hinders the performance of machine learning models designed to trade and invest in these assets. Generative methods can mitigate this shortage. In this paper, we introduce a set of novel techniques for time series data generation (we name them Fiaingen) and assess their performance across three criteria: (a) overlap of real-world and synthetic data on a reduced dimensionality space, (b) performance on downstream machine learning tasks, and (c) runtime performance. Our experiments demonstrate that the methods achieve state-of-the-art performance across the three criteria listed above. Synthetic data generated with Fiaingen methods more closely mirrors the original time series data while keeping data generation time close to seconds - ensuring the scalability of the proposed approach. Furthermore, models trained on it achieve performance close to those trained with real-world data.
- Abstract(参考訳): 機械学習モデルは、投資や取引決定に正確で堅牢なモデルが不可欠である金融における研究と実践的応用を前進させる上で、データは不可欠である。
しかし、実世界のデータは、その量、品質、多様性にもかかわらず制限されている。
さまざまな金融資産のデータ不足は、これらの資産の売買と投資のために設計された機械学習モデルのパフォーマンスを直接妨げている。
生成的手法はこの不足を軽減することができる。
本稿では,時系列データ生成のための新しい手法を紹介し,その性能を3つの基準で評価する。
(a)次元空間の縮小に関する実世界のデータと合成データの重複
(b)下流機械学習タスクにおける性能、及び
(c) 実行時のパフォーマンス。
本実験は, 上述の3つの基準にまたがって, 最先端の性能を実現することを実証した。
Fiaingenメソッドで生成された合成データは、データ生成時間を数秒に近く保ちながら、元の時系列データをより深く反映し、提案したアプローチのスケーラビリティを保証する。
さらに、トレーニングされたモデルは、実世界のデータでトレーニングされたモデルに近いパフォーマンスを達成する。
関連論文リスト
- Empowering Time Series Analysis with Synthetic Data: A Survey and Outlook in the Era of Foundation Models [104.17057231661371]
時系列解析は複雑なシステムの力学を理解するために重要である。
基本モデルの最近の進歩はタスク非依存の時系列基礎モデル (TSFM) と大規模言語モデルベース時系列モデル (TSLLM) につながっている。
彼らの成功は、規制、多様性、品質、量制約のために構築が困難である、大規模で多様で高品質なデータセットに依存する。
本調査では,TSFMとTLLLMの合成データの総合的なレビュー,データ生成戦略の分析,モデル事前学習におけるそれらの役割,微調整,評価,今後の研究方向性の特定について述べる。
論文 参考訳(メタデータ) (2025-03-14T13:53:46Z) - FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.70072722290475]
ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。
FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文 参考訳(メタデータ) (2025-02-26T05:19:16Z) - Simulation as Reality? The Effectiveness of LLM-Generated Data in Open-ended Question Assessment [7.695222586877482]
本研究では,AIに基づくアセスメントツールの限界に対処するため,シミュレーションデータの可能性とギャップについて検討する。
シミュレーションデータから, 自動評価モデルのトレーニングにおいて有望な結果が得られたが, 有効性には顕著な限界があることが判明した。
過度に処理された実世界のデータにも存在する実世界のノイズとバイアスが存在しないことが、この制限に寄与する。
論文 参考訳(メタデータ) (2025-02-10T11:40:11Z) - From Machine Learning to Machine Unlearning: Complying with GDPR's Right to be Forgotten while Maintaining Business Value of Predictive Models [9.380866972744633]
この研究は、Ensemble-based iTerative Information Distillation (ETID)と呼ばれる、総合的な機械学習から学習へのフレームワークを開発する。
ETIDには、データ消去要求の処理を容易にする正確な予測モデルを構築するための、新しいアンサンブル学習手法が組み込まれている。
また, 効率的かつ効率的なデータ消去を実現するために, 構築されたアンサンブルモデルに適した, 蒸留に基づく未学習手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T05:42:46Z) - Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。
本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文 参考訳(メタデータ) (2024-10-22T06:43:28Z) - On the Stability of Iterative Retraining of Generative Models on their own Data [56.153542044045224]
混合データセットに対する生成モデルの訓練が与える影響について検討する。
まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。
我々は、正規化フローと最先端拡散モデルを繰り返し訓練することにより、合成画像と自然画像の両方に関する我々の理論を実証的に検証する。
論文 参考訳(メタデータ) (2023-09-30T16:41:04Z) - Quantifying Quality of Class-Conditional Generative Models in
Time-Series Domain [4.219228636765818]
Inception Time Score(ITS)とFrechet Inception Time Distance(FITD)を導入し、時系列領域におけるクラス条件生成モデルの質的性能を評価する。
提案した指標の識別能力を調べるため,80種類のデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-10-14T08:13:20Z) - Machine Learning for Temporal Data in Finance: Challenges and
Opportunities [0.0]
一時データは金融サービス(FS)業界で広く使われている。
しかし、機械学習の取り組みは、これらのデータの時間的豊かさを説明できないことが多い。
論文 参考訳(メタデータ) (2020-09-11T19:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。