論文の概要: Creating Disasters: Recession Forecasting with GAN-Generated Synthetic
Time Series Data
- arxiv url: http://arxiv.org/abs/2302.10490v1
- Date: Tue, 21 Feb 2023 07:38:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 16:07:59.734084
- Title: Creating Disasters: Recession Forecasting with GAN-Generated Synthetic
Time Series Data
- Title(参考訳): 災害発生:gan合成時系列データを用いた不況予測
- Authors: Sam Dannels
- Abstract要約: 近年のディープラーニングとGAN(Generative Adversarial Network)の進歩により,高忠実な合成データを大量に生成することが可能になった。
本稿では、合成時系列データを生成するのに適したGANであるDoppelGANgerと呼ばれるモデルを用いて、合成大蔵省収率時系列と関連する不況指標を生成する。
合成不況のトレーニングモデルは、実際のデータのみに基づいてトレーニングされたモデルよりも、将来の不況を予測するモデルの能力を向上させることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A common problem when forecasting rare events, such as recessions, is limited
data availability. Recent advancements in deep learning and generative
adversarial networks (GANs) make it possible to produce high-fidelity synthetic
data in large quantities. This paper uses a model called DoppelGANger, a GAN
tailored to producing synthetic time series data, to generate synthetic
Treasury yield time series and associated recession indicators. It is then
shown that short-range forecasting performance for Treasury yields is improved
for models trained on synthetic data relative to models trained only on real
data. Finally, synthetic recession conditions are produced and used to train
classification models to predict the probability of a future recession. It is
shown that training models on synthetic recessions can improve a model's
ability to predict future recessions over a model trained only on real data.
- Abstract(参考訳): 不況などのまれな事象を予測する場合の一般的な問題は、データ可用性の制限である。
近年のディープラーニングとGAN(Generative Adversarial Network)の進歩により,高忠実な合成データを大量に生成することが可能になった。
本論文は,合成時系列データを生成するためのganであるdoppelgangerと呼ばれるモデルを用いて,合成国債利回り時系列および関連する不況指標を生成する。
そして, 実データのみを用いて訓練したモデルに対して, 合成データに基づいて訓練したモデルに対して, 財務収率の短期予測性能が向上することを示した。
最後に、合成不況条件が生成され、将来の不況の確率を予測するために分類モデルを訓練するために使用される。
合成不況のトレーニングモデルは、実際のデータのみに基づいてトレーニングされたモデルよりも将来の不況を予測するモデルの能力を向上させることができる。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - How Bad is Training on Synthetic Data? A Statistical Analysis of Language Model Collapse [9.59833542807268]
モデル崩壊は、以前に訓練されたモデルから生成された合成データに基づいて新しいモデルが訓練されたときに起こる。
合成データのみを用いたトレーニングでは,モデル崩壊は回避できないことを示す。
モデル崩壊を回避できる合成データの最大量を推定する。
論文 参考訳(メタデータ) (2024-04-07T22:15:13Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - On the Stability of Iterative Retraining of Generative Models on their own Data [56.153542044045224]
混合データセットに対する生成モデルの訓練が与える影響について検討する。
まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。
我々は、正規化フローと最先端拡散モデルを繰り返し訓練することにより、合成画像と自然画像の両方に関する我々の理論を実証的に検証する。
論文 参考訳(メタデータ) (2023-09-30T16:41:04Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - A Bayesian Generative Adversarial Network (GAN) to Generate Synthetic
Time-Series Data, Application in Combined Sewer Flow Prediction [3.3139597764446607]
機械学習では、生成モデル(generative model)は、データ分散を学習して人工データを生成する方法のクラスである。
本研究では,限られた時系列データのバランスをとるために,合成時系列を生成するGANモデルを開発した。
本研究の目的は, 降水量データを用いて流れを予測し, モデル性能における合成データを用いたデータ増大の影響を検討することである。
論文 参考訳(メタデータ) (2023-01-31T16:12:26Z) - Time-series Transformer Generative Adversarial Networks [5.254093731341154]
本稿では,時系列データに特化して生じる制約について考察し,合成時系列を生成するモデルを提案する。
合成時系列データを生成するモデルには,(1)実列の段階的条件分布を捉えること,(2)実列全体の結合分布を忠実にモデル化すること,の2つの目的がある。
TsT-GANは、Transformerアーキテクチャを活用してデシラタを満足させ、その性能を5つのデータセット上の5つの最先端モデルと比較するフレームワークである。
論文 参考訳(メタデータ) (2022-05-23T10:04:21Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Forecasting Industrial Aging Processes with Machine Learning Methods [0.0]
我々は、従来のステートレスモデルとより複雑なリカレントニューラルネットワークを比較して、幅広いデータ駆動モデルを評価する。
以上の結果から,リカレントモデルでは,より大きなデータセットでトレーニングした場合,ほぼ完璧な予測が得られた。
論文 参考訳(メタデータ) (2020-02-05T13:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。