論文の概要: DAMBench: A Multi-Modal Benchmark for Deep Learning-based Atmospheric Data Assimilation
- arxiv url: http://arxiv.org/abs/2511.01468v1
- Date: Mon, 03 Nov 2025 11:26:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.241583
- Title: DAMBench: A Multi-Modal Benchmark for Deep Learning-based Atmospheric Data Assimilation
- Title(参考訳): DAMBench: ディープラーニングベースの大気データ同化のためのマルチモーダルベンチマーク
- Authors: Hao Wang, Zixuan Weng, Jindong Han, Wei Fan, Hao Liu,
- Abstract要約: DAMBenchは,実環境下でのデータ駆動型DAモデルを評価するための,最初の大規模マルチモーダルベンチマークである。
DAMBenchは最先端の予測システムと実世界のマルチモーダル観測から高品質なバックグラウンド状態を統合する。
統一評価プロトコルとベンチマークデータ同化手法を提供する。
- 参考スコア(独自算出の注目度): 14.776071715723262
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data Assimilation is a cornerstone of atmospheric system modeling, tasked with reconstructing system states by integrating sparse, noisy observations with prior estimation. While traditional approaches like variational and ensemble Kalman filtering have proven effective, recent advances in deep learning offer more scalable, efficient, and flexible alternatives better suited for complex, real-world data assimilation involving large-scale and multi-modal observations. However, existing deep learning-based DA research suffers from two critical limitations: (1) reliance on oversimplified scenarios with synthetically perturbed observations, and (2) the absence of standardized benchmarks for fair model comparison. To address these gaps, in this work, we introduce DAMBench, the first large-scale multi-modal benchmark designed to evaluate data-driven DA models under realistic atmospheric conditions. DAMBench integrates high-quality background states from state-of-the-art forecasting systems and real-world multi-modal observations (i.e., real-world weather stations and satellite imagery). All data are resampled to a common grid and temporally aligned to support systematic training, validation, and testing. We provide unified evaluation protocols and benchmark representative data assimilation approaches, including latent generative models and neural process frameworks. Additionally, we propose a lightweight multi-modal plugin to demonstrate how integrating realistic observations can enhance even simple baselines. Through comprehensive experiments, DAMBench establishes a rigorous foundation for future research, promoting reproducibility, fair comparison, and extensibility to real-world multi-modal scenarios. Our dataset and code are publicly available at https://github.com/figerhaowang/DAMBench.
- Abstract(参考訳): データ同化(Data Assimilation)は、大気系のモデリングの基礎であり、疎度でノイズの多い観測と事前推定を統合することで、システムの状態を再構築する。
変分フィルターやアンサンブル・カルマン・フィルタリングのような従来の手法は効果があるが、近年のディープラーニングの進歩はよりスケーラブルで効率的で柔軟な代替手段を提供し、大規模なマルチモーダル観測を含む複雑な実世界のデータ同化に適している。
しかし,既存の深層学習に基づくDA研究は,(1)合成摂動観測による過度に単純化されたシナリオへの依存,(2)公正モデル比較のための標準ベンチマークの欠如という2つの限界に悩まされている。
DAMBenchは,実環境下でのデータ駆動型DAモデルを評価するために設計された,最初の大規模マルチモーダルベンチマークである。
DAMBenchは最先端の予測システムと実世界のマルチモーダル観測(現実世界の気象観測所や衛星画像など)から高品質な背景状態を統合する。
すべてのデータは共通のグリッドに再サンプリングされ、システマティックなトレーニング、バリデーション、テストをサポートするために時間的に整列される。
我々は、潜在生成モデルやニューラルプロセスフレームワークを含む統一評価プロトコルとベンチマークデータ同化アプローチを提供する。
さらに,現実的な観測の統合が,単純なベースラインをさらに強化することを示すために,軽量なマルチモーダルプラグインを提案する。
包括的な実験を通じて、DAMBenchは将来の研究のための厳格な基盤を確立し、再現性、公正な比較、実世界のマルチモーダルシナリオへの拡張を促進する。
データセットとコードはhttps://github.com/figerhaowang/DAMBench.comで公開されています。
関連論文リスト
- Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - Hierarchically Disentangled Recurrent Network for Factorizing System Dynamics of Multi-scale Systems: An application on Hydrological Systems [4.634606500665259]
複数の時間スケールでシステムダイナミクスを分解する新しい階層的リカレントニューラルネットワークを提案する。
国立気象局ノース・セントラル・リバー・フォアキャスト・センターからの幾らかの捕獲実験では、FHNNが標準ベースラインを上回っていることを示している。
我々は,FHNNが,効果的な事前学習戦略とグローバルモデルの訓練を通じて,限られたトレーニングデータであっても精度を維持することができることを示す。
論文 参考訳(メタデータ) (2024-07-29T16:25:43Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Deep Generative Data Assimilation in Multimodal Setting [0.1052166918701117]
本研究では,マルチモーダル・セッティングにおけるスコアベースラテント・アシミレーション(SLAMS)を提案する。
気象観測所のデータと衛星画像とを同化して、垂直温度分布を世界規模で校正する。
私たちの研究は、実世界のデータセットを用いたマルチモーダルデータ同化に、初めて深層生成フレームワークを適用しました。
論文 参考訳(メタデータ) (2024-04-10T00:25:09Z) - Urban Sound Propagation: a Benchmark for 1-Step Generative Modeling of Complex Physical Systems [8.04779839951237]
本稿では,速度と物理的正確性の観点から,1ステップの推論モデルの評価のためのベンチマークを示す。
本ベンチマークは, 都市環境における音源からの波動の2次元伝播をモデル化する, 物理的に複雑で実用的な作業に基づくものである。
我々は100kのサンプルを用いて,各サンプルがOpenStreetmapから引き出された実2次元ビルディングマップとパラメータ化された音源と,与えられたシーンに対する模擬地上真実音の伝搬からなるデータセットを提供する。
論文 参考訳(メタデータ) (2024-03-16T11:38:58Z) - A Generative Learning Approach for Spatio-temporal Modeling in Connected
Vehicular Network [55.852401381113786]
本稿では,コネクテッドカーの無線アクセス遅延を実現するための総合的時間品質フレームワークであるLaMI(Latency Model Inpainting)を提案する。
LaMIはイメージインペイントと合成のアイデアを採用し、2段階の手順で欠落したレイテンシサンプルを再構築することができる。
特に、パッチ方式のアプローチを用いて各地域で収集されたサンプル間の空間的相関を初めて発見し、その後、原点および高度に相関したサンプルをバラエナオートコーダ(VAE)に供給する。
論文 参考訳(メタデータ) (2020-03-16T03:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。