論文の概要: Applications of synthetic financial data in portfolio and risk modeling
- arxiv url: http://arxiv.org/abs/2512.21798v1
- Date: Thu, 25 Dec 2025 22:28:32 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 12:02:23.752898
- Title: Applications of synthetic financial data in portfolio and risk modeling
- Title(参考訳): ポートフォリオにおける合成財務データの活用とリスクモデリング
- Authors: Christophe D. Hounwanou, Yae Ulrich Gaba,
- Abstract要約: 本稿では、ポートフォリオ構築、トレーディング分析、リスクモデリングをサポートする合成リターンシリーズ作成のための生成モデルの利用について検討する。
TimeGANは、分布形状、ボラティリティパターン、および実際のリターンで観測されたものに近い自己相関挙動を持つ合成データを生成する。
この分析は、ポートフォリオ分析とリスクシミュレーションにおいて、実際の財務データの代用として合成データセットの使用をサポートする。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Synthetic financial data offers a practical way to address the privacy and accessibility challenges that limit research in quantitative finance. This paper examines the use of generative models, in particular TimeGAN and Variational Autoencoders (VAEs), for creating synthetic return series that support portfolio construction, trading analysis, and risk modeling. Using historical daily returns from the S and P 500 as a benchmark, we generate synthetic datasets under comparable market conditions and evaluate them using statistical similarity metrics, temporal structure tests, and downstream financial tasks. The study shows that TimeGAN produces synthetic data with distributional shapes, volatility patterns, and autocorrelation behaviour that are close to those observed in real returns. When applied to mean-variance portfolio optimization, the resulting synthetic datasets lead to portfolio weights, Sharpe ratios, and risk levels that remain close to those obtained from real data. The VAE provides more stable training but tends to smooth extreme market movements, which affects risk estimation. Finally, the analysis supports the use of synthetic datasets as substitutes for real financial data in portfolio analysis and risk simulation, particularly when models are able to capture temporal dynamics. Synthetic data therefore provides a privacy-preserving, cost-effective, and reproducible tool for financial experimentation and model development.
- Abstract(参考訳): 合成金融データは、量的金融の研究を制限するプライバシーとアクセシビリティの課題に対処する実用的な方法を提供する。
本稿では, ポートフォリオ構築, トレーディング分析, リスクモデリングをサポートする合成リターン系列の作成に, 生成モデル, 特に TimeGAN と 変分オートエンコーダ (VAEs) を用いて検討する。
SとP500の過去の日次リターンをベンチマークとして、同等の市場条件下で合成データセットを生成し、統計的類似度指標、時間構造テスト、下流財務タスクを用いて評価する。
この研究は、TimeGANが実際のリターンで観測されたものに近い分布形状、揮発性パターン、自己相関行動を持つ合成データを生成することを示した。
平均分散ポートフォリオ最適化に適用した場合、得られた合成データセットは、実際のデータから得られたものに近いポートフォリオ重量、シャープ比、リスクレベルにつながる。
VAEはより安定したトレーニングを提供するが、リスク見積もりに影響を与える極端な市場の動きを円滑にする傾向がある。
最後に、ポートフォリオ分析とリスクシミュレーションにおける実際の財務データの代用として、合成データセットの使用をサポートする。
したがって、合成データは、金融実験とモデル開発のためのプライバシー保護、費用対効果、再現可能なツールを提供する。
関連論文リスト
- Synthetic Financial Data Generation for Enhanced Financial Modelling [0.0]
本稿では,合成財務データのための統合型マルチ基準評価フレームワークを提案する。
過去のSとP500の日次データを用いて、下流タスクにおける忠実度(最大平均離散性、MD)、時間構造(自己相関とボラティリティクラスタリング)、実用性を評価する。
アプリケーションのニーズや計算制約に応じて生成モデルを選択するための実践的ガイドラインを明確に述べる。
論文 参考訳(メタデータ) (2025-12-25T21:43:16Z) - Re(Visiting) Time Series Foundation Models in Finance [3.295157175236371]
金融時系列予測は、トレーディング、ポートフォリオ最適化、リスク管理の中心である。
時系列基礎モデル(TSFM)の最近の進歩は、大規模で多様なデータセットから一般化可能な時間表現を学習するための新しいパラダイムを提供する。
本稿では,グローバル金融市場におけるTSFMの総合的研究について紹介する。
論文 参考訳(メタデータ) (2025-11-23T18:44:19Z) - New Money: A Systematic Review of Synthetic Data Generation for Finance [0.0874967598360817]
合成データ生成は、機械学習アプリケーションでセンシティブな財務データを使用する際の課題に対処するための、有望なアプローチである。
プライバシのリスクと規制の制約を緩和しながら、実際の財務記録の統計特性を保存する人工データセットを作成することができる。
この体系的なレビューは、合成財務データ生成に焦点を当てた2018年以降に発表された72の研究を統合し、分析する。
論文 参考訳(メタデータ) (2025-10-30T02:21:59Z) - Valid Inference with Imperfect Synthetic Data [39.10587411316875]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Empowering Time Series Analysis with Synthetic Data: A Survey and Outlook in the Era of Foundation Models [104.17057231661371]
時系列解析は複雑なシステムの力学を理解するために重要である。
基本モデルの最近の進歩はタスク非依存の時系列基礎モデル (TSFM) と大規模言語モデルベース時系列モデル (TSLLM) につながっている。
彼らの成功は、規制、多様性、品質、量制約のために構築が困難である、大規模で多様で高品質なデータセットに依存する。
本調査では,TSFMとTLLLMの合成データの総合的なレビュー,データ生成戦略の分析,モデル事前学習におけるそれらの役割,微調整,評価,今後の研究方向性の特定について述べる。
論文 参考訳(メタデータ) (2025-03-14T13:53:46Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - Does Synthetic Data Make Large Language Models More Efficient? [0.0]
本稿では,NLPにおける合成データ生成のニュアンスについて考察する。
データ拡張の可能性や構造化品種の導入など、その利点を強調します。
テンプレートベースの合成データが現代の変圧器モデルの性能に与える影響を実証する。
論文 参考訳(メタデータ) (2023-10-11T19:16:09Z) - FinDiff: Diffusion Models for Financial Tabular Data Generation [5.824064631226058]
FinDiffは、さまざまな規制下流タスクのための現実世界の財務データを生成するために設計された拡散モデルである。
3つの実世界の財務データセットを用いて、最先端のベースラインモデルに対して評価される。
論文 参考訳(メタデータ) (2023-09-04T09:30:15Z) - Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - DeepVol: Volatility Forecasting from High-Frequency Data with Dilated Causal Convolutions [53.37679435230207]
本稿では,Dilated Causal Convolutionsに基づくDeepVolモデルを提案する。
実験結果から,提案手法は高頻度データからグローバルな特徴を効果的に学習できることが示唆された。
論文 参考訳(メタデータ) (2022-09-23T16:13:47Z) - Gaussian process imputation of multiple financial series [71.08576457371433]
金融指標、株価、為替レートなどの複数の時系列は、市場が潜んでいる状態に依存しているため、強く結びついている。
金融時系列間の関係を多出力ガウスプロセスでモデル化することで学習することに注力する。
論文 参考訳(メタデータ) (2020-02-11T19:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。