論文の概要: Retrofitting Earth System Models with Cadence-Limited Neural Operator Updates
- arxiv url: http://arxiv.org/abs/2512.03309v1
- Date: Tue, 02 Dec 2025 23:44:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-04 20:02:55.044007
- Title: Retrofitting Earth System Models with Cadence-Limited Neural Operator Updates
- Title(参考訳): ケーデンス制限型ニューラル演算子更新による地球系モデルの再適合
- Authors: Aniruddha Bora, Shixuan Zhang, Khemraj Shukla, Bryce Harrop, George Em. Karniadakis, L. Ruby Leung,
- Abstract要約: 本稿では,瞬時モデル状態をバイアス補正傾向にマッピングする演算子学習フレームワークを提案する。
ERA5の再解析に向け、2年間のE3SMシミュレーションを訓練し、オペレーターは高度と季節にまたがって一般化する。
本フレームワークは, 長期的安定性, ポータビリティ, ケイデンス限定更新を重視し, 表現力のあるML演算子の有用性を実証する。
- 参考スコア(独自算出の注目度): 3.9578288463123
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Coarse resolution, imperfect parameterizations, and uncertain initial states and forcings limit Earth-system model (ESM) predictions. Traditional bias correction via data assimilation improves constrained simulations but offers limited benefit once models run freely. We introduce an operator-learning framework that maps instantaneous model states to bias-correction tendencies and applies them online during integration. Building on a U-Net backbone, we develop two operator architectures Inception U-Net (IUNet) and a multi-scale network (M\&M) that combine diverse upsampling and receptive fields to capture multiscale nonlinear features under Energy Exascale Earth System Model (E3SM) runtime constraints. Trained on two years E3SM simulations nudged toward ERA5 reanalysis, the operators generalize across height levels and seasons. Both architectures outperform standard U-Net baselines in offline tests, indicating that functional richness rather than parameter count drives performance. In online hybrid E3SM runs, M\&M delivers the most consistent bias reductions across variables and vertical levels. The ML-augmented configurations remain stable and computationally feasible in multi-year simulations, providing a practical pathway for scalable hybrid modeling. Our framework emphasizes long-term stability, portability, and cadence-limited updates, demonstrating the utility of expressive ML operators for learning structured, cross-scale relationships and retrofitting legacy ESMs.
- Abstract(参考訳): 粗い解像度、不完全なパラメータ化、不確実な初期状態、強制は地球系モデル(ESM)の予測を制限する。
データ同化による従来のバイアス補正は、制約付きシミュレーションを改善するが、モデルが自由に動作すれば、利益は制限される。
我々は、瞬時モデル状態とバイアス補正傾向をマッピングし、統合中にそれらをオンラインに適用する演算子学習フレームワークを導入する。
Inception U-Net (IUNet) とM\&M (M\&M) の2つのオペレーターアーキテクチャを構築し、多様なアップサンプリングと受信フィールドを組み合わせて、E3SM (Energy Exascale Earth System Model) ランタイム制約下でのマルチスケール非線形特徴をキャプチャする。
E3SMシミュレーションはERA5の再分析のために2年間訓練され、オペレーターは高度と季節にまたがって一般化した。
両方のアーキテクチャは、オフラインテストにおいて標準のU-Netベースラインよりも優れており、パラメータカウントよりも機能的なリッチ性によってパフォーマンスが向上していることを示している。
オンラインハイブリッドE3SMの実行では、M\&Mは変数と垂直レベルの最も一貫したバイアス低減を提供する。
ML拡張構成は、マルチ年シミュレーションにおいて安定かつ計算可能であり、スケーラブルなハイブリッドモデリングのための実用的な経路を提供する。
我々のフレームワークは、長期的安定性、ポータビリティ、ケイデンスに制限のある更新を強調し、構造化された、クロススケールな関係を学習し、レガシーESMを復元するための表現型ML演算子の有用性を実証する。
関連論文リスト
- Agentic World Modeling for 6G: Near-Real-Time Generative State-Space Reasoning [70.56067503630486]
第6世代(6G)インテリジェンスは、流動的なトークン予測ではなく、想像と選択の能力を校正している、と我々は主張する。
We showed that WM-MS3M cuts mean absolute error (MAE) by 1.69% vs MS3M with 32% less parameters and similar latency, and achieve a 35-80% lower root mean squared error (RMSE) than attention/hybrid baselines with 2.3-4.1x faster inference。
論文 参考訳(メタデータ) (2025-11-04T17:22:22Z) - URDF-Anything: Constructing Articulated Objects with 3D Multimodal Language Model [76.08429266631823]
3次元マルチモーダル大言語モデル(MLLM)に基づくエンドツーエンドの自動再構築フレームワークを提案する。
URDF-Anythingは、ポイントクラウドとテキストマルチモーダル入力に基づく自己回帰予測フレームワークを使用して、幾何学的セグメンテーションと運動論的パラメータ予測を協調的に最適化する。
シミュレーションと実世界の両方のデータセットの実験は、我々の手法が既存の手法よりも大幅に優れていることを示した。
論文 参考訳(メタデータ) (2025-11-02T13:45:51Z) - A Mixture of Experts Gating Network for Enhanced Surrogate Modeling in External Aerodynamics [0.28647133890966997]
Mixture of Experts (MoE) モデルは、3つの異種、最先端の代理モデルの予測を組み合わせる。
システム全体のトレーニングと検証は、自動車空気力学のための高忠実度CFDシミュレーションの大規模でパブリックなベンチマークであるDrivAerMLデータセットで行われている。
論文 参考訳(メタデータ) (2025-08-28T22:34:10Z) - World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - Time Marching Neural Operator FE Coupling: AI Accelerated Physics Modeling [3.0635300721402228]
本研究は、物理インフォームド・ディープ・オペレーター・ネットワークをドメイン分解によりFEMと統合する新しいハイブリッド・フレームワークを導入する。
動的システムの課題に対処するため、DeepONetに直接タイムステッピングスキームを組み込み、長期エラーの伝搬を大幅に低減する。
提案手法は, 従来手法に比べて収束率を最大20%向上させるとともに, 誤差マージンが3%未満の解の忠実度を保ちながら, 収束率の高速化を図っている。
論文 参考訳(メタデータ) (2025-04-15T16:54:04Z) - DSMoE: Matrix-Partitioned Experts with Dynamic Routing for Computation-Efficient Dense LLMs [86.76714527437383]
本稿では,事前学習したFFN層を計算ブロックに分割することで,分散化を実現するDSMoEを提案する。
我々は,Sigmoid アクティベーションとストレートスルー推定器を用いた適応型エキスパートルーティングを実装し,トークンがモデル知識の様々な側面に柔軟にアクセスできるようにする。
LLaMAモデルを用いた実験により、DSMoEは既存のプルーニング法やMoE法に比べて優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-02-18T02:37:26Z) - Longhorn: State Space Models are Amortized Online Learners [51.10124201221601]
ステートスペースモデル(SSM)は、トレーニング中に並列性を維持しながら線形デコード効率を提供する。
本研究では、オンライン学習のレンズを通してSSM設計を探求し、特定のオンライン学習問題のメタモジュールとしてSSMを概念化する。
我々は、オンライン連想的リコール問題を解決するためのクローズドフォームソリューションに類似した、新しいディープSSMアーキテクチャであるLonghornを紹介した。
論文 参考訳(メタデータ) (2024-07-19T11:12:08Z) - Stragglers-Aware Low-Latency Synchronous Federated Learning via Layer-Wise Model Updates [71.81037644563217]
同期フェデレーションラーニング(FL)は、協調エッジラーニングの一般的なパラダイムである。
一部のデバイスは計算資源が限られており、様々な可用性があるため、FLレイテンシはストラグラーに非常に敏感である。
本稿では,NNの最適化手法をバックプロパゲーションにより活用し,グローバルモデルを階層的に更新するストラグラー対応層対応学習(SALF)を提案する。
論文 参考訳(メタデータ) (2024-03-27T09:14:36Z) - SwapMoE: Serving Off-the-shelf MoE-based Large Language Models with Tunable Memory Budget [20.33693233516486]
我々は,学習可能なメモリ予算を備えたMoEベースの大規模言語モデルの効率的な機能を実現するためのフレームワークであるSwapMoEを紹介する。
SwapMoEは適切な精度を維持しながらメモリフットプリントを削減できることが実験で示されている。
論文 参考訳(メタデータ) (2023-08-29T05:25:21Z) - Asynchronous Multi-Model Dynamic Federated Learning over Wireless
Networks: Theory, Modeling, and Optimization [20.741776617129208]
分散機械学習(ML)の鍵となる技術として、フェデレートラーニング(FL)が登場した。
まず、システムパラメータが学習性能に与える影響を捉えるために、長方形のスケジューリングステップと関数を定式化する。
我々の分析は、デバイストレーニング変数と非同期スケジューリング決定の協調的影響に光を当てている。
論文 参考訳(メタデータ) (2023-05-22T21:39:38Z) - ES-dRNN: A Hybrid Exponential Smoothing and Dilated Recurrent Neural
Network Model for Short-Term Load Forecasting [1.4502611532302039]
複雑な時系列(TS)のため、短期負荷予測(STLF)は困難である
本稿では,複数の季節性を扱うハイブリッド階層型ディープラーニングモデルを提案する。
指数スムージング(ES)とリカレントニューラルネットワーク(RNN)を組み合わせる。
論文 参考訳(メタデータ) (2021-12-05T19:38:42Z) - Autoregressive Dynamics Models for Offline Policy Evaluation and
Optimization [60.73540999409032]
表現的自己回帰ダイナミクスモデルが次の状態の異なる次元を生成し、以前の次元で順次条件付きで報酬を得ることを示す。
また,リプレイバッファを充実させる手段として,自己回帰的ダイナミクスモデルがオフラインポリシー最適化に有用であることを示す。
論文 参考訳(メタデータ) (2021-04-28T16:48:44Z) - A Hybrid Residual Dilated LSTM end Exponential Smoothing Model for
Mid-Term Electric Load Forecasting [1.1602089225841632]
このモデルは指数的平滑化(ETS)、高度なLong Short-Term Memory(LSTM)とアンサンブルを組み合わせたものである。
欧州35か国における月次電力需要時系列のシミュレーション研究により,提案モデルの高性能性が確認された。
論文 参考訳(メタデータ) (2020-03-29T10:53:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。