Fugu-MT 論文翻訳(概要): CA-MoE: Channel-Adapted MoE for Incremental Weather Forecasting

論文の概要: CA-MoE: Channel-Adapted MoE for Incremental Weather Forecasting

arxiv url: http://arxiv.org/abs/2412.02503v1
Date: Tue, 03 Dec 2024 15:30:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-04 21:11:23.03232
Title: CA-MoE: Channel-Adapted MoE for Incremental Weather Forecasting
Title（参考訳）: CA-MoE:Channel-Adapted MoE for Incremental Weather Forecasting
Authors: Hao Chen, Han Tao, Guo Song, Jie Zhang, Yunlong Yu, Yonghan Dong, Chuang Yang, Lei Bai,
Abstract要約: 天気予報に漸進的な学習を導入し、モデル内の変数の柔軟な拡張を可能にする新しい構造を提案する。具体的には,チャネル適応型MOE (CA-MoE) を提案する。広く利用されているERA5データセットを用いて行った実験により,インクリメンタルな段階でトレーニング可能なパラメータの約15%しか利用できず,最先端の競合と同等の性能が得られることがわかった。
参考スコア（独自算出の注目度）: 20.84335120477223
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Atmospheric science is intricately connected with other fields, e.g., geography and aerospace. Most existing approaches involve training a joint atmospheric and geographic model from scratch, which incurs significant computational costs and overlooks the potential for incremental learning of weather variables across different domains. In this paper, we introduce incremental learning to weather forecasting and propose a novel structure that allows for the flexible expansion of variables within the model. Specifically, our method presents a Channel-Adapted MoE (CA-MoE) that employs a divide-and-conquer strategy. This strategy assigns variable training tasks to different experts by index embedding and reduces computational complexity through a channel-wise Top-K strategy. Experiments conducted on the widely utilized ERA5 dataset reveal that our method, utilizing only approximately 15\% of trainable parameters during the incremental stage, attains performance that is on par with state-of-the-art competitors. Notably, in the context of variable incremental experiments, our method demonstrates negligible issues with catastrophic forgetting.
Abstract（参考訳）: 大気科学は他の分野、例えば地理や航空宇宙と複雑に結びついている。既存のアプローチのほとんどは、スクラッチから大気と地理の合同モデルを訓練することを含んでおり、これは計算コストを大幅に上回っており、異なる領域にわたる気象変数の漸進的な学習の可能性を見落としている。本稿では,天気予報に漸進的な学習を導入し,モデル内の変数の柔軟な拡張を可能にする新しい構造を提案する。具体的には,チャネル適応型MOE (CA-MoE) を提案する。この戦略は、インデックス埋め込みによって異なる専門家に可変トレーニングタスクを割り当て、チャネルワイドのTop-K戦略を通じて計算複雑性を低減させる。広く利用されているERA5データセットを用いて行った実験により,インクリメンタル段階におけるトレーニング可能なパラメータの約15%しか利用できず,最先端の競合と同等の性能が得られることがわかった。特に, 変動インクリメンタルな実験の文脈では, 破滅的な忘れ込みを伴う無視可能な問題を示す。

関連論文リスト

Echo State Networks for Time Series Forecasting: Hyperparameter Sweep and Benchmarking [51.56484100374058]
我々は、完全に自動で純粋にフィードバック駆動のESNが、広く使われている統計的予測手法の代替となるかどうかを評価する。予測精度は、MASEとsMAPEを用いて測定され、ドリフトや季節予測、統計モデルといった単純なベンチマークと比較される。
論文参考訳（メタデータ） (2026-02-03T16:01:22Z)
Diffusion models for probabilistic precipitation generation from atmospheric variables [1.6099193327384094]
地球系モデル(ESM)では、降水は明示的には解決されず、パラメータ化によって表される。本稿では,条件付き拡散モデルとUNetアーキテクチャを統合した生成機械学習に基づく新しい手法を提案する。従来のパラメータ化とは異なり、我々のフレームワークは効率的にアンサンブル予測を生成し、降水の不確実性を把握し、手作業による微調整を必要としない。
論文参考訳（メタデータ） (2025-04-01T00:21:31Z)
Masked Autoregressive Model for Weather Forecasting [7.960598061739508]
Masked Autoregressive Model for Weather Forecasting (MAM4WF) 本研究では,MAM4WF(Masked Autoregressive Model for Weather Forecasting)を提案する。このモデルは、トレーニング中に入力データの一部をマスクするマスク付きモデリングを利用する。気象・気象予報・映像フレーム予測データを用いてMAM4WFを評価し,5つのテストデータセットにおいて優れた性能を示した。
論文参考訳（メタデータ） (2024-09-30T09:17:04Z)
Efficient Localized Adaptation of Neural Weather Forecasting: A Case Study in the MENA Region [62.09891513612252]
地域レベルのダウンストリームタスクに特化して、リミテッド・エリア・モデリングに焦点を合わせ、モデルをトレーニングします。我々は,気象予報が水資源の管理,農業,極度の気象事象の影響軽減に重要であるという,気象学的課題からMENA地域を考察する。本研究では,パラメータ効率のよい微調整手法,特にローランド適応(LoRA)とその変種を統合することの有効性を検証することを目的とした。
論文参考訳（メタデータ） (2024-09-11T19:31:56Z)
Forecast-PEFT: Parameter-Efficient Fine-Tuning for Pre-trained Motion Forecasting Models [68.23649978697027]
Forecast-PEFTは、モデルのパラメータの大部分を凍結し、新しく導入されたプロンプトとアダプタの調整に集中する微調整戦略である。実験の結果,Forecast-PEFTは動作予測タスクにおいて従来のフルチューニング手法よりも優れていた。 Forecast-FTは予測性能をさらに改善し、従来のベースライン法よりも最大9.6%向上した。
論文参考訳（メタデータ） (2024-07-28T19:18:59Z)
Diversifying the Expert Knowledge for Task-Agnostic Pruning in Sparse Mixture-of-Experts [75.85448576746373]
本稿では,モデルのパラメータ効率を向上させるために,類似の専門家をグループ化し,グループ化する方法を提案する。提案手法の有効性を3つの最先端MoEアーキテクチャを用いて検証する。評価の結果,本手法は自然言語タスクにおいて,他のモデルプルーニング手法よりも優れていることがわかった。
論文参考訳（メタデータ） (2024-07-12T17:25:02Z)
VarteX: Enhancing Weather Forecast through Distributed Variable Representation [5.2980803808373516]
近年のデータ駆動型モデルでは, 予測性能の深層学習を利用して, 数値的な天気予報に勝っている。本研究では,新しい変数集約方式と,その課題に対する効率的な学習フレームワークを提案する。
論文参考訳（メタデータ） (2024-06-28T02:42:30Z)
Stock Volume Forecasting with Advanced Information by Conditional Variational Auto-Encoder [49.97673761305336]
本研究では,短時間・長期の予測作業において,日当たりのストックボリューム時系列の予測を改善するために,条件変動(CVAE)を用いることを実証する。 CVAEは非線形時系列をサンプル外予測として生成し、精度が向上し、実際のデータとの相関関係がより緊密になる。
論文参考訳（メタデータ） (2024-06-19T13:13:06Z)
Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.13352174687475]
本稿では,天気予報をトレーニングデータセットを超える微細な時間スケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。また、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークも導入する。
論文参考訳（メタデータ） (2024-05-22T16:21:02Z)
Analyzing and Exploring Training Recipes for Large-Scale Transformer-Based Weather Prediction [1.3194391758295114]
比較的オフ・ザ・シェルフアーキテクチャ、簡単な訓練手順、適度な計算予算でも高い予測能力が得られることを示す。具体的には、ERA5データに基づいて最小修正SwinV2変換器をトレーニングし、IFSと比較すると優れた予測技術が得られることを確かめる。
論文参考訳（メタデータ） (2024-04-30T15:30:14Z)
MetaSD: A Unified Framework for Scalable Downscaling of Meteorological Variables in Diverse Situations [8.71735078449217]
本稿ではメタラーニングを活用した統一的なダウンスケーリング手法を提案する。 ERA5, GFSから温度, 風, 表面圧力, 総降水量からなる変数を訓練した。提案手法は, 対流降水量, 電位, エネルギー高さ, 湿度CFS, S2S, CMIP6の時間スケールに拡張可能である。
論文参考訳（メタデータ） (2024-04-26T06:31:44Z)
ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.6987191099507]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。また,複数のランダムサンプルを用いて予測結果の不確かさをキャプチャするExBoosterについても紹介する。提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文参考訳（メタデータ） (2024-02-02T10:34:13Z)
FengWu-4DVar: Coupling the Data-driven Weather Forecasting Model with 4D Variational Assimilation [67.20588721130623]
我々は,AIを用いた循環型天気予報システムFengWu-4DVarを開発した。 FengWu-4DVarは観測データをデータ駆動の天気予報モデルに組み込むことができる。シミュレーションされた観測データセットの実験は、FengWu-4DVarが合理的な解析場を生成することができることを示した。
論文参考訳（メタデータ） (2023-12-16T02:07:56Z)
Federated Prompt Learning for Weather Foundation Models on Devices [37.88417074427373]
天気予報のためのデバイス上のインテリジェンスでは、ローカルなディープラーニングモデルを使用して、集中型クラウドコンピューティングなしで気象パターンを分析する。本稿では,FedPoD(Federated Prompt Learning for Weather Foundation Models on Devices)を提案する。 FedPoDは、通信効率を維持しながら、高度にカスタマイズされたモデルを得ることができる。
論文参考訳（メタデータ） (2023-05-23T16:59:20Z)
W-MAE: Pre-trained weather model with masked autoencoder for multi-variable weather forecasting [7.610811907813171]
天気予報のための事前学習を行うMasked AutoEncoderを用いた気象モデルを提案する。 W-MAEは、気象変数内の空間的相関を再構成するために、自己教師付きで事前訓練される。時間スケールでは、事前訓練されたW-MAEを微調整し、気象変数の将来状態を予測する。
論文参考訳（メタデータ） (2023-04-18T06:25:11Z)
Hybrid Variational Autoencoder for Time Series Forecasting [12.644797358419618]
変分オートエンコーダ(VAE)は、入力データの潜在表現をランダム変数として学習する強力な生成モデルである。時系列予測のための変分推論による局所パターンと時間ダイナミクスの学習を統合するためのハイブリッド変分オートエンコーダ(HyVAE)を提案する。
論文参考訳（メタデータ） (2023-03-13T12:13:28Z)
ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。気候データセットの自己教師型学習目標で事前トレーニングすることができる。気候や気候の様々な問題に対処するために、微調整が可能である。
論文参考訳（メタデータ） (2023-01-24T23:19:01Z)
Guaranteed Conservation of Momentum for Learning Particle-based Fluid Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文参考訳（メタデータ） (2022-10-12T09:12:59Z)
SwinVRNN: A Data-Driven Ensemble Forecasting Model via Learned Distribution Perturbation [16.540748935603723]
本研究では,SwinRNN予測器と摂動モジュールを組み合わせた天気予報モデルであるSwinVRNNを提案する。 SwinVRNNはECMWF統合予測システム(IFS)を2m温度と6時間総降水量で最大5日間のリードタイムで上回っている。
論文参考訳（メタデータ） (2022-05-26T05:11:58Z)
Data-Driven Evaluation of Training Action Space for Reinforcement Learning [1.370633147306388]
本稿では,行動空間の分類とランク付けを訓練するためのShapleyに着想を得た方法論を提案する。指数時間シェープ計算を減らすため、モンテカルロシミュレーションを含む。提案したデータ駆動手法は、異なるドメイン、ユースケース、強化学習アルゴリズムへのRLである。
論文参考訳（メタデータ） (2022-04-08T04:53:43Z)
Reservoir Computing as a Tool for Climate Predictability Studies [0.0]
我々は、Reservoir Computingが線形逆モデリングアプローチの予測スキルを改善する代替非線形アプローチを提供することを示す。 RC手法の幅広い条件に対する予測能力の向上は、この機械学習技術が気候予測可能性研究に有効である可能性を示唆している。
論文参考訳（メタデータ） (2021-02-24T22:22:59Z)
Learning to Continuously Optimize Wireless Resource In Episodically Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文参考訳（メタデータ） (2020-11-16T08:24:34Z)
Unsupervised Dense Shape Correspondence using Heat Kernels [50.682560435495034]
本稿では,近年の深層関数マップフレームワークを用いて,形状間の密接な対応を学習するための教師なし手法を提案する。地平線対応や計算に高価な測地線距離に依存するのではなく、熱核を用いる。本稿では,部分性,トポロジカルノイズ,接続性の違いなど,様々な課題があるベンチマークに対して,本手法の結果を示す。
論文参考訳（メタデータ） (2020-10-23T21:54:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。