論文の概要: Learning to Advect: A Neural Semi-Lagrangian Architecture for Weather Forecasting
- arxiv url: http://arxiv.org/abs/2601.21151v1
- Date: Thu, 29 Jan 2026 01:20:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.500849
- Title: Learning to Advect: A Neural Semi-Lagrangian Architecture for Weather Forecasting
- Title(参考訳): アドベクトへの学習: 天気予報のためのニューラルネットワーク半ラグランジアンアーキテクチャ
- Authors: Carlos A. Pereira, Stéphane Gaudreault, Valentin Dallerit, Christopher Subich, Shoyon Panday, Siqi Wei, Sasa Zhang, Siddharth Rout, Eldad Haber, Raymond J. Spiteri, David Millard, Emilia Diaconescu,
- Abstract要約: 気象予報に対する最近の機械学習アプローチは、しばしばモノリシックなアーキテクチャを採用する。
本稿では,ネットワークの挙動に帰納バイアスを課す物理に着想を得たグローバル気象予報モデルPARADISを提案する。
球面上の微分可能な軌道に基づく輸送を行うニューラルセミ・ラグランジアン演算子による対流を実装した。
拡散様過程は深度的に分離可能な空間混合によってモデル化され、一方、局所的ソース項と垂直的相互作用はポイントワイドチャネル相互作用を介してモデル化される。
- 参考スコア(独自算出の注目度): 6.433158386048011
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent machine-learning approaches to weather forecasting often employ a monolithic architecture, where distinct physical mechanisms (advection, transport), diffusion-like mixing, thermodynamic processes, and forcing are represented implicitly within a single large network. This representation is particularly problematic for advection, where long-range transport must be treated with expensive global interaction mechanisms or through deep, stacked convolutional layers. To mitigate this, we present PARADIS, a physics-inspired global weather prediction model that imposes inductive biases on network behavior through a functional decomposition into advection, diffusion, and reaction blocks acting on latent variables. We implement advection through a Neural Semi-Lagrangian operator that performs trajectory-based transport via differentiable interpolation on the sphere, enabling end-to-end learning of both the latent modes to be transported and their characteristic trajectories. Diffusion-like processes are modeled through depthwise-separable spatial mixing, while local source terms and vertical interactions are modeled via pointwise channel interactions, enabling operator-level physical structure. PARADIS provides state-of-the-art forecast skill at a fraction of the training cost. On ERA5-based benchmarks, the 1 degree PARADIS model, with a total training cost of less than a GPU month, meets or exceeds the performance of 0.25 degree traditional and machine-learning baselines, including the ECMWF HRES forecast and DeepMind's GraphCast.
- Abstract(参考訳): 気象予報に対する最近の機械学習のアプローチは、異なる物理的メカニズム(対流、輸送)、拡散のような混合、熱力学過程、強制が単一の大きなネットワーク内で暗黙的に表現される、モノリシックなアーキテクチャをしばしば採用している。
この表現は特に対流に問題があり、長距離輸送は高価なグローバルな相互作用機構や、深く積み重ねられた畳み込み層を通して扱う必要がある。
これを緩和するために,我々は,潜伏変数に作用する対流,拡散,反応ブロックへの機能的分解を通じて,ネットワーク行動に誘導的バイアスを課す物理に着想を得た大域気象予測モデルPARADISを提案する。
球面上の微分可能な補間により軌道に基づく輸送を行うニューラルセミ・ラグランジアン演算子による対流を実装し、両方の潜伏モードとその特性軌跡のエンドツーエンド学習を可能にする。
拡散様過程は深度的に分離可能な空間混合によってモデル化され、一方、局所的源泉項と垂直的相互作用はポイントワイドチャネル相互作用によってモデル化され、演算子レベルの物理的構造が実現される。
PARADISは、トレーニングコストのごく一部で最先端の予測スキルを提供する。
ECMWF HRES予測やDeepMindのGraphCastなど、ERA5ベースのベンチマークでは、トレーニングコストが1ヶ月未満の1度のPARADISモデルで、従来の0.25度のベースラインのパフォーマンスを達成または超える。
関連論文リスト
- Inverse Autoregressive Flows for Zero Degree Calorimeter fast simulation [0.0]
物理ベースの機械学習は、従来の科学と現代のデータ駆動技術を融合させる。
CERNにおけるALICE実験におけるZDC(Zero Degree Calorimeter)のシミュレーションを高速化するために,このパラダイムを活用する。
我々の手法は古典的データ駆動モデル同化よりも優れており、ZDCシミュレーション文献の既存のNF実装よりも421倍高速なモデルが得られる。
論文 参考訳(メタデータ) (2025-12-23T13:28:15Z) - Few-Shot Learning by Explicit Physics Integration: An Application to Groundwater Heat Transport [41.94295877935867]
ローカルGlobal Convolutional Neural Network (LGCNN) アプローチが導入された。
モデルはまずランダムな入力場に基づいて系統的に解析される。
そして、このモデルは、ドイツのミュンヘン地域の現実世界の古典地図から、いくつかのカットアウトで訓練される。
論文 参考訳(メタデータ) (2025-07-08T15:06:15Z) - Transformers from Diffusion: A Unified Framework for Neural Message Passing [79.9193447649011]
メッセージパッシングニューラルネットワーク(MPNN)は、デファクトクラスのモデルソリューションとなっている。
本稿では,拡散の誘導バイアスとエネルギーの層的制約を統合するエネルギー制約拡散モデルを提案する。
これらの知見に基づいて、我々はTransformer (DIFFormer)と呼ばれる新しいタイプのメッセージパッシングモデルを考案した。
論文 参考訳(メタデータ) (2024-09-13T17:54:41Z) - Stragglers-Aware Low-Latency Synchronous Federated Learning via Layer-Wise Model Updates [71.81037644563217]
同期フェデレーションラーニング(FL)は、協調エッジラーニングの一般的なパラダイムである。
一部のデバイスは計算資源が限られており、様々な可用性があるため、FLレイテンシはストラグラーに非常に敏感である。
本稿では,NNの最適化手法をバックプロパゲーションにより活用し,グローバルモデルを階層的に更新するストラグラー対応層対応学習(SALF)を提案する。
論文 参考訳(メタデータ) (2024-03-27T09:14:36Z) - Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。
MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。
本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文 参考訳(メタデータ) (2022-06-29T22:19:03Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Physics Guided Machine Learning Methods for Hydrology [21.410993515618895]
SWAT (Soil and Water Assessment Tool) と組み合わせたLSTMに基づくディープラーニングアーキテクチャを提案する。
アプローチの有効性はミネソタ州南東部のルート川流域の南支流にあるいくつかの小さな流域で分析されている。
論文 参考訳(メタデータ) (2020-12-02T19:17:19Z) - A physics-informed operator regression framework for extracting
data-driven continuum models [0.0]
高忠実度分子シミュレーションデータから連続体モデルを発見するためのフレームワークを提案する。
提案手法は、モーダル空間における制御物理のニューラルネットワークパラメタライゼーションを適用する。
局所・非局所拡散過程や単相・多相流など,様々な物理分野におけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-09-25T01:13:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。