論文の概要: Synthetic Flight Data Generation Using Generative Models
- arxiv url: http://arxiv.org/abs/2604.20293v1
- Date: Wed, 22 Apr 2026 07:46:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.022907
- Title: Synthetic Flight Data Generation Using Generative Models
- Title(参考訳): 生成モデルを用いた合成飛行データ生成
- Authors: Karim Aly, Alexei Sharpanskykh,
- Abstract要約: 本研究では,現実的な合成飛行データを生成するための生成モデルの可能性について検討する。
合成飛行データの必要性は、秘密の現実世界記録の代替となる可能性から生じる。
タブラル変分オートエンコーダ(TVAE)とガウスコプラ(GC)の2つの生成モデルを用いて合成飛行情報を生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing adoption of synthetic data in aviation research offers a promising solution to data scarcity and confidentiality challenges. This study investigates the potential of generative models to produce realistic synthetic flight data and evaluates their quality through a comprehensive four-stage assessment framework. The need for synthetic flight data arises from their potential to serve as an alternative to confidential real-world records and to augment rare events in historical datasets. These enhanced datasets can then be used to train machine learning models that predict critical events, such as flight delays, cancellations, diversions, and turnaround times. Two generative models, Tabular Variational Autoencoder (TVAE) and Gaussian Copula (GC), are adapted to generate synthetic flight information and compared based on their ability to preserve statistical similarity, fidelity, diversity, and predictive utility. Results indicate that while GC achieves higher statistical similarity and fidelity, its computational cost hinders its applicability to large datasets. In contrast, TVAE efficiently handles large datasets and enables scalable synthetic data generation. The findings demonstrate that synthetic data can support flight delay prediction models with accuracy comparable to those trained on real data. These results pave the way for leveraging synthetic flight data to enhance predictive modeling in air transportation.
- Abstract(参考訳): 航空研究における合成データの採用の増加は、データの不足と機密性の課題に対する有望な解決策を提供する。
本研究では, 現実的な合成飛行データを生成するための生成モデルの可能性について検討し, 総合的な4段階評価フレームワークを用いて品質評価を行う。
合成飛行データの必要性は、秘密の現実世界の記録の代替として機能し、歴史的なデータセットで稀な出来事を増大させる可能性から生じる。
これらの強化データセットを使用して、フライト遅延、キャンセル、反転、ターンアラウンドタイムなどの重要なイベントを予測する機械学習モデルをトレーニングすることができる。
Tabular Variational Autoencoder (TVAE) と Gaussian Copula (GC) の2つの生成モデルは、合成飛行情報を生成するために適応され、統計的類似性、忠実性、多様性、予測ユーティリティを保存できる能力に基づいて比較される。
その結果、GCは高い統計的類似性と忠実性を達成するが、計算コストは大きなデータセットに適用し難いことを示している。
対照的に、TVAEは大規模なデータセットを効率的に処理し、スケーラブルな合成データ生成を可能にする。
その結果,実データと同等の精度で,合成データが飛行遅延予測モデルをサポートできることが示唆された。
これらの結果は、航空輸送における予測モデリングを強化するために、合成飛行データを活用するための道を開いた。
関連論文リスト
- Generative Augmentation of Imbalanced Flight Records for Flight Diversion Prediction: A Multi-objective Optimisation Framework [0.0]
飛行の転換はまれであるが、航空における高影響の出来事であり、安全性と運用効率の両方において信頼性の高い予測が不可欠である。
本研究は, モデルトレーニングを向上し, 予測精度を向上させるために, 生成モデルが合成ディバージョンレコードを用いて過去の飛行データを増大させる方法について検討する。
論文 参考訳(メタデータ) (2026-04-22T07:35:11Z) - Valid Inference with Imperfect Synthetic Data [39.10587411316875]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Scaling Laws of Synthetic Data for Language Models [125.41600201811417]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文 参考訳(メタデータ) (2025-03-25T11:07:12Z) - Enhancing Indoor Temperature Forecasting through Synthetic Data in Low-Data Environments [42.8983261737774]
合成データ生成のためのSoTA AI を用いたデータ拡張手法の有効性について検討する。
そこで本研究では,実データと合成データの融合戦略を探求し,予測モデルの改善を図る。
論文 参考訳(メタデータ) (2024-06-07T12:36:31Z) - Boosting Data Analytics With Synthetic Volume Expansion [3.568650932986342]
本稿では,合成データに対する統計的手法の有効性と,合成データのプライバシーリスクについて考察する。
この枠組みにおける重要な発見は、合成データに対する統計的手法の誤差率は、より多くの合成データを追加することで減少するが、最終的には上昇または安定化する可能性があることを明らかにする世代効果である。
論文 参考訳(メタデータ) (2023-10-27T01:57:27Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - On the Stability of Iterative Retraining of Generative Models on their own Data [56.153542044045224]
混合データセットに対する生成モデルの訓練が与える影響について検討する。
まず、初期生成モデルがデータ分布を十分に近似する条件下で反復学習の安定性を実証する。
我々は、正規化フローと最先端拡散モデルを繰り返し訓練することにより、合成画像と自然画像の両方に関する我々の理論を実証的に検証する。
論文 参考訳(メタデータ) (2023-09-30T16:41:04Z) - A Bayesian Generative Adversarial Network (GAN) to Generate Synthetic
Time-Series Data, Application in Combined Sewer Flow Prediction [3.3139597764446607]
機械学習では、生成モデル(generative model)は、データ分散を学習して人工データを生成する方法のクラスである。
本研究では,限られた時系列データのバランスをとるために,合成時系列を生成するGANモデルを開発した。
本研究の目的は, 降水量データを用いて流れを予測し, モデル性能における合成データを用いたデータ増大の影響を検討することである。
論文 参考訳(メタデータ) (2023-01-31T16:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。