論文の概要: Data-Efficient Ensemble Weather Forecasting with Diffusion Models
- arxiv url: http://arxiv.org/abs/2509.11047v1
- Date: Sun, 14 Sep 2025 02:22:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.885193
- Title: Data-Efficient Ensemble Weather Forecasting with Diffusion Models
- Title(参考訳): 拡散モデルを用いたデータ効率の良いアンサンブル天気予報
- Authors: Kevin Valencia, Ziyang Liu, Justin Cui,
- Abstract要約: 拡散モデルは一般的に自己回帰的であり、計算コストが高い。
これは、データが制限され、コストがかかり、作業が難しい気候科学における課題である。
我々は,複数のデータサンプリング戦略を評価し,簡単な時間的階層化サンプリング手法により,実データトレーニングと同等以上の性能が得られることを示す。
- 参考スコア(独自算出の注目度): 5.03317364227682
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although numerical weather forecasting methods have dominated the field, recent advances in deep learning methods, such as diffusion models, have shown promise in ensemble weather forecasting. However, such models are typically autoregressive and are thus computationally expensive. This is a challenge in climate science, where data can be limited, costly, or difficult to work with. In this work, we explore the impact of curated data selection on these autoregressive diffusion models. We evaluate several data sampling strategies and show that a simple time stratified sampling approach achieves performance similar to or better than full-data training. Notably, it outperforms the full-data model on certain metrics and performs only slightly worse on others while using only 20% of the training data. Our results demonstrate the feasibility of data-efficient diffusion training, especially for weather forecasting, and motivates future work on adaptive or model-aware sampling methods that go beyond random or purely temporal sampling.
- Abstract(参考訳): 数値的な天気予報手法がこの分野を支配しているが,近年の拡散モデルのような深層学習手法の進歩は,アンサンブル天気予報の可能性を示唆している。
しかし、そのようなモデルは一般的に自己回帰的であり、計算コストが高い。
これは、データが制限され、コストがかかり、作業が難しい気候科学における課題である。
本研究では,これらの自己回帰拡散モデルに対するキュレートされたデータ選択の影響について検討する。
我々は,複数のデータサンプリング戦略を評価し,簡単な時間的階層化サンプリング手法により,実データトレーニングと同等以上の性能が得られることを示す。
特に、特定のメトリクスで完全なデータモデルより優れており、トレーニングデータの20%しか使用していないが、他のメトリクスではわずかにパフォーマンスが悪くなっている。
本研究は,特に天気予報のためのデータ効率拡散訓練の実現可能性を示し,ランダムあるいは純粋に時間的サンプリングを超える適応的・モデル対応サンプリング手法の今後の取り組みを動機づけるものである。
関連論文リスト
- Breaking Silos: Adaptive Model Fusion Unlocks Better Time Series Forecasting [64.45587649141842]
時系列予測は多くの現実世界のアプリケーションにおいて重要な役割を果たす。
1つのモデルは、異なるテストサンプルで一貫して他よりも優れていますが、(ii) それぞれのモデルは特定のケースで優れています。
異種モデルのサンプルレベル適応融合による時系列予測のためのフレームワークであるTimeFuseを紹介する。
論文 参考訳(メタデータ) (2025-05-24T00:45:07Z) - Adaptive Non-Uniform Timestep Sampling for Diffusion Model Training [4.760537994346813]
データ分布が複雑化するにつれて、収束のためのトレーニング拡散モデルがますます複雑になる。
より重要な時間ステップを優先する一様でない時間ステップサンプリング手法を提案する。
提案手法は, 各種データセット, スケジューリング戦略, 拡散アーキテクチャにまたがるロバストな性能を示す。
論文 参考訳(メタデータ) (2024-11-15T07:12:18Z) - On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - ReAugment: Model Zoo-Guided RL for Few-Shot Time Series Augmentation and Forecasting [74.00765474305288]
本稿では,時系列データ拡張のための強化学習(RL)の試験的検討を行う。
我々の手法であるReAugmentは、トレーニングセットのどの部分が拡張されるべきか、どのように拡張を行うべきか、RLがプロセスにどのような利点をもたらすのか、という3つの重要な問題に取り組む。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Learning Defect Prediction from Unrealistic Data [57.53586547895278]
事前訓練されたコードのモデルは、コード理解と生成タスクに人気がある。
このようなモデルは大きい傾向があり、訓練データの総量を必要とする。
人工的に注入されたバグのある関数など、はるかに大きくてもより現実的なデータセットを持つモデルをトレーニングすることが一般的になった。
このようなデータで訓練されたモデルは、実際のプログラムでは性能が劣りながら、同様のデータでのみうまく機能する傾向にある。
論文 参考訳(メタデータ) (2023-11-02T01:51:43Z) - Precipitation nowcasting with generative diffusion models [0.0]
降水処理における拡散モデルの有効性について検討した。
本研究は, 確立されたU-Netモデルの性能と比較したものである。
論文 参考訳(メタデータ) (2023-08-13T09:51:16Z) - BOOT: Data-free Distillation of Denoising Diffusion Models with
Bootstrapping [64.54271680071373]
拡散モデルは多様な画像を生成する優れた可能性を示している。
知識蒸留は、推論ステップの数を1つか数に減らすための治療法として最近提案されている。
本稿では,効率的なデータフリー蒸留アルゴリズムにより限界を克服するBOOTと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T20:30:55Z) - A case study of spatiotemporal forecasting techniques for weather forecasting [4.347494885647007]
実世界のプロセスの相関は時間的であり、それらによって生成されたデータは空間的および時間的進化の両方を示す。
時系列モデルが数値予測の代替となる。
本研究では,分解時間予測モデルにより計算コストを低減し,精度を向上することを示した。
論文 参考訳(メタデータ) (2022-09-29T13:47:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。