論文の概要: Synthetic Financial Data Generation for Enhanced Financial Modelling
- arxiv url: http://arxiv.org/abs/2512.21791v1
- Date: Thu, 25 Dec 2025 21:43:16 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:58:01.664172
- Title: Synthetic Financial Data Generation for Enhanced Financial Modelling
- Title(参考訳): 金融モデル強化のための合成金融データ生成
- Authors: Christophe D. Hounwanou, Yae Ulrich Gaba, Pierre Ntakirutimana,
- Abstract要約: 本稿では,合成財務データのための統合型マルチ基準評価フレームワークを提案する。
過去のSとP500の日次データを用いて、下流タスクにおける忠実度(最大平均離散性、MD)、時間構造(自己相関とボラティリティクラスタリング)、実用性を評価する。
アプリケーションのニーズや計算制約に応じて生成モデルを選択するための実践的ガイドラインを明確に述べる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Data scarcity and confidentiality in finance often impede model development and robust testing. This paper presents a unified multi-criteria evaluation framework for synthetic financial data and applies it to three representative generative paradigms: the statistical ARIMA-GARCH baseline, Variational Autoencoders (VAEs), and Time-series Generative Adversarial Networks (TimeGAN). Using historical S and P 500 daily data, we evaluate fidelity (Maximum Mean Discrepancy, MMD), temporal structure (autocorrelation and volatility clustering), and practical utility in downstream tasks, specifically mean-variance portfolio optimization and volatility forecasting. Empirical results indicate that ARIMA-GARCH captures linear trends and conditional volatility but fails to reproduce nonlinear dynamics; VAEs produce smooth trajectories that underestimate extreme events; and TimeGAN achieves the best trade-off between realism and temporal coherence (e.g., TimeGAN attained the lowest MMD: 1.84e-3, average over 5 seeds). Finally, we articulate practical guidelines for selecting generative models according to application needs and computational constraints. Our unified evaluation protocol and reproducible codebase aim to standardize benchmarking in synthetic financial data research.
- Abstract(参考訳): データ不足と金融の機密性は、しばしばモデル開発と堅牢なテストを妨げる。
本稿では、合成財務データのための統合されたマルチ基準評価フレームワークを提案し、統計的ARIMA-GARCHベースライン、変分オートエンコーダ(VAE)、時系列生成支援ネットワーク(TimeGAN)の3つの代表的な生成パラダイムに適用する。
従来のSとP500の日次データを用いて、時間的構造(自己相関とボラティリティクラスタリング)、下流タスク、特に平均分散ポートフォリオ最適化とボラティリティ予測の実用性を評価する。
実験の結果、ARIMA-GARCHは線形傾向と条件変動を捉えるが非線形力学を再現できず、VAEは極端事象を過小評価するスムーズな軌道を発生し、TimeGANは現実主義と時間的コヒーレンス(例えば、TimeGANは最低のMDD: 1.84e-3, average over 5 seed)を達成している。
最後に,アプリケーションのニーズや計算制約に応じて生成モデルを選択するための実践的ガイドラインを述べる。
総合的な評価プロトコルと再現可能なコードベースは,総合的な財務データ研究におけるベンチマークの標準化を目的としている。
関連論文リスト
- Applications of synthetic financial data in portfolio and risk modeling [0.0]
本稿では、ポートフォリオ構築、トレーディング分析、リスクモデリングをサポートする合成リターンシリーズ作成のための生成モデルの利用について検討する。
TimeGANは、分布形状、ボラティリティパターン、および実際のリターンで観測されたものに近い自己相関挙動を持つ合成データを生成する。
この分析は、ポートフォリオ分析とリスクシミュレーションにおいて、実際の財務データの代用として合成データセットの使用をサポートする。
論文 参考訳(メタデータ) (2025-12-25T22:28:32Z) - Real-Time Performance Analysis of Multi-Fidelity Residual Physics-Informed Neural Process-Based State Estimation for Robotic Systems [0.0]
MFR-PINP(Multi-fidelity residual Physics-informed Neural Process)に基づく新しいリアルタイム・データ駆動型推定手法を提案する。
具体的には、MFR-PINPを課題とし、MFR-PINPのモデルミスマッチ問題に対処し、単純で低忠実な予測と複雑で高忠実な基底トラスダイナミクスの間の残差を学習する。
本稿では,MFR-PINPに基づくハイブリッドオンライン学習環境のための推定器の実装について述べる。
論文 参考訳(メタデータ) (2025-11-11T13:30:51Z) - Fiaingen: A financial time series generative method matching real-world data quality [2.333354880278056]
時系列データ生成のための新しいテクニックのセットを紹介する(Fiaingenと名づける)。
a)次元空間を縮小した実世界のデータと合成データの重複、(b)下流機械学習タスクにおけるパフォーマンス、(c)実行時のパフォーマンスの3つの基準でそれらの性能を評価する。
実験により, 上述の3つの基準にまたがって, 最先端の性能を達成できることが実証された。
論文 参考訳(メタデータ) (2025-10-01T17:55:08Z) - Dynamic Lagging for Time-Series Forecasting in E-Commerce Finance: Mitigating Information Loss with A Hybrid ML Architecture [0.8192992814374568]
動的ラグ機能工学と適応型ローリングウインドウ表現を統合したハイブリッド予測フレームワークを提案する。
提案手法は、請求書レベルの行動モデリング、サポートデータの構造化ラグ、およびカスタム安定性を考慮した損失関数を明示的に組み込んだものである。
論文 参考訳(メタデータ) (2025-09-24T15:33:16Z) - FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.70072722290475]
ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。
FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文 参考訳(メタデータ) (2025-02-26T05:19:16Z) - Optimizing Sequential Recommendation Models with Scaling Laws and Approximate Entropy [104.48511402784763]
SRモデルの性能法則は,モデルの性能とデータ品質の関係を理論的に調査し,モデル化することを目的としている。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文 参考訳(メタデータ) (2024-11-30T10:56:30Z) - Deep Generative Modeling for Financial Time Series with Application in
VaR: A Comparative Review [22.52651841623703]
ヒストリカル・シミュレーション(HS)は、翌日にリスクファクターの予測分布が戻ると、ヒストリカル・ウィンドウにおける日々のリターンの実証的な分布を利用する。
HS, GARCH および CWGAN モデルは, 歴史的USD 収率曲線データと GARCH および CIR プロセスからシミュレーションした追加データの両方で試験される。
研究によると、トップパフォーマンスモデルはHS、GARCH、CWGANモデルである。
論文 参考訳(メタデータ) (2024-01-18T20:35:32Z) - Generative Modeling of Regular and Irregular Time Series Data via Koopman VAEs [50.25683648762602]
モデルの新しい設計に基づく新しい生成フレームワークであるKoopman VAEを紹介する。
クープマン理論に触発され、線形写像を用いて潜在条件事前力学を表現する。
KoVAEは、いくつかの挑戦的な合成および実世界の時系列生成ベンチマークにおいて、最先端のGANおよびVAEメソッドより優れている。
論文 参考訳(メタデータ) (2023-10-04T07:14:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。