Fugu-MT 論文翻訳(概要): Inductive biases in deep learning models for weather prediction

論文の概要: Inductive biases in deep learning models for weather prediction

arxiv url: http://arxiv.org/abs/2304.04664v1
Date: Thu, 6 Apr 2023 14:15:46 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-11 14:33:41.772543
Title: Inductive biases in deep learning models for weather prediction
Title（参考訳）: 気象予測のためのディープラーニングモデルにおける誘導バイアス
Authors: Jannik Thuemmel (1), Matthias Karlbauer (1), Sebastian Otte (1), Christiane Zarfl (1), Georg Martius (2), Nicole Ludwig (1), Thomas Scholten (1), Ulrich Friedrich (3), Volker Wulfmeyer (4), Bedartha Goswami (1), Martin V. Butz (1) ((1) University of T\"ubingen, (2) Max Planck Institute for Intelligent Systems, (3) Deutscher Wetterdienst, (4) University of Hohenheim)
Abstract要約: 我々は6つの最先端のディープラーニング天気予報モデルの帰納バイアスをレビューし分析する。 5つの設計要素のそれぞれの設計選択が構造的仮定にどのように関係しているかを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep learning has recently gained immense popularity in the Earth sciences as it enables us to formulate purely data-driven models of complex Earth system processes. Deep learning-based weather prediction (DLWP) models have made significant progress in the last few years, achieving forecast skills comparable to established numerical weather prediction (NWP) models with comparatively lesser computational costs. In order to train accurate, reliable, and tractable DLWP models with several millions of parameters, the model design needs to incorporate suitable inductive biases that encode structural assumptions about the data and modelled processes. When chosen appropriately, these biases enable faster learning and better generalisation to unseen data. Although inductive biases play a crucial role in successful DLWP models, they are often not stated explicitly and how they contribute to model performance remains unclear. Here, we review and analyse the inductive biases of six state-of-the-art DLWP models, involving a deeper look at five key design elements: input data, forecasting objective, loss components, layered design of the deep learning architectures, and optimisation methods. We show how the design choices made in each of the five design elements relate to structural assumptions. Given recent developments in the broader DL community, we anticipate that the future of DLWP will likely see a wider use of foundation models -- large models pre-trained on big databases with self-supervised learning -- combined with explicit physics-informed inductive biases that allow the models to provide competitive forecasts even at the more challenging subseasonal-to-seasonal scales.
Abstract（参考訳）: 深層学習は最近、複雑な地球系プロセスの純粋データ駆動モデルを定式化できるため、地球科学で大きな人気を集めています。深層学習に基づく天気予報(DLWP)モデルはここ数年で大きく進歩し、比較的少ない計算コストで確立された数値天気予報(NWP)モデルに匹敵する予測スキルを達成した。数百万のパラメータで正確で信頼性があり、抽出可能なDLWPモデルをトレーニングするために、モデル設計は、データとモデル化プロセスに関する構造的仮定を符号化する適切な帰納的バイアスを組み込む必要がある。適切に選択すると、これらのバイアスはより高速な学習とより優れた一般化を可能にする。インダクティブバイアスはdlwpモデルの成功において重要な役割を果たすが、しばしば明示的に述べられておらず、モデルのパフォーマンスにどのように寄与するかはいまだ不明である。本稿では,6つの最先端dlwpモデルの帰納的バイアスをレビューおよび分析し,入力データ,予測対象,損失コンポーネント,ディープラーニングアーキテクチャの階層設計,最適化手法の5つの重要な設計要素を深く見ていく。 5つの設計要素のそれぞれの設計選択が構造的仮定にどのように関係しているかを示す。近年のDLWPコミュニティの発展を踏まえると,DLWPの将来は,大規模データベースで事前訓練された大規模モデル – 自己教師付き学習による大規模モデル – と,より困難なサブシーズンからシーズンのスケールでも,モデルが競争力のある予測を提供する明示的な物理インフォームによる帰納的バイアス – を,より広範な利用が期待できる。

関連論文リスト

Understanding the Implicit Biases of Design Choices for Time Series Foundation Models [90.894232610821]
時系列基礎モデル(TSFM)は、時系列予測と関連する時間的タスクのための潜在的に強力で汎用的なツールのクラスである。彼らの行動はデザインの微妙な帰納的バイアスによって強く形作られています。モデルやデータの性質によって、これらのバイアスが直感的であるか、非常に直感的であるかを示す。
論文参考訳（メタデータ） (2025-10-22T04:42:35Z)
Detecting Prefix Bias in LLM-based Reward Models [4.596249232904721]
選好データセットに基づいて訓練された報酬モデルにおいて,プレフィックスバイアスを検知し,評価するための新しい手法を提案する。これらの指標を活用して、人種と性別の異なる嗜好モデルにおける大きなバイアスを明らかにします。本研究は,公正かつ信頼性の高い報酬モデルを開発する上で,バイアス対応データセットの設計と評価を重要視するものである。
論文参考訳（メタデータ） (2025-05-13T21:50:03Z)
Can Kans (re)discover predictive models for Direct-Drive Laser Fusion? [11.261403205522694]
レーザー融合の領域は、機械学習手法のためのユニークで挑戦的な予測モデリングアプリケーションランドスケープを示す。データ駆動型アプローチは、物理学の期待に沿う望ましい一般化能力とモデル解釈を達成するために、過去に成功してきた。本研究では,新しいタイプのデータ駆動予測モデルの開発において,PILの代替としてKAN(Kolmogorov-Arnold Networks)を用いた。
論文参考訳（メタデータ） (2024-09-13T13:48:06Z)
Learning-based Models for Vulnerability Detection: An Extensive Study [3.1317409221921144]
我々は、最先端の学習ベースアプローチの2つのタイプを広範かつ包括的に調査する。本稿では,シーケンスベースモデルの優先度と,グラフベースモデルの限定能力について実験的に検証する。
論文参考訳（メタデータ） (2024-08-14T13:01:30Z)
A Data-Centric Perspective on Evaluating Machine Learning Models for Tabular Data [9.57464542357693]
実世界のモデリングパイプラインは、しばしばデータセット固有の前処理と特徴工学を必要とするため、モデル中心の評価は偏りがあることを実証する。 Kaggleコンペティションから10の関連するデータセットを選択し、データセット毎に専門家レベルの前処理パイプラインを実装します。データセット固有の機能エンジニアリングの後、モデルランキングは大幅に変化し、性能差が減少し、モデル選択の重要性が低下する。
論文参考訳（メタデータ） (2024-07-02T09:54:39Z)
Low-rank finetuning for LLMs: A fairness perspective [54.13240282850982]
低ランク近似技術は、微調整された大規模言語モデルのデファクトスタンダードとなっている。本稿では,これらの手法が初期訓練済みデータ分布から微調整データセットのシフトを捉える上での有効性について検討する。低ランク微調整は好ましくない偏見や有害な振る舞いを必然的に保存することを示す。
論文参考訳（メタデータ） (2024-05-28T20:43:53Z)
Analyzing and Exploring Training Recipes for Large-Scale Transformer-Based Weather Prediction [1.3194391758295114]
比較的オフ・ザ・シェルフアーキテクチャ、簡単な訓練手順、適度な計算予算でも高い予測能力が得られることを示す。具体的には、ERA5データに基づいて最小修正SwinV2変換器をトレーニングし、IFSと比較すると優れた予測技術が得られることを確かめる。
論文参考訳（メタデータ） (2024-04-30T15:30:14Z)
Addressing Bias Through Ensemble Learning and Regularized Fine-Tuning [0.2812395851874055]
本稿では,AIモデルのバイアスを取り除くために,複数の手法を用いた包括的アプローチを提案する。我々は、データ分割、局所訓練、正規化ファインチューニングを通じて、事前訓練されたモデルのカウンターバイアスで複数のモデルを訓練する。我々は、単一のバイアスのないニューラルネットワークをもたらす知識蒸留を用いて、ソリューションを結論付けている。
論文参考訳（メタデータ） (2024-02-01T09:24:36Z)
Measuring Causal Effects of Data Statistics on Language Model's `Factual' Predictions [59.284907093349425]
大量のトレーニングデータが、最先端のNLPモデルの高性能化の大きな理由の1つである。トレーニングデータがどのように予測に影響を及ぼすかを記述するための言語を,因果的フレームワークを通じて提供する。我々のフレームワークは、高価なモデルの再訓練の必要性を回避し、観測データのみに基づいて因果効果を推定することができる。
論文参考訳（メタデータ） (2022-07-28T17:36:24Z)
Human Trajectory Prediction via Neural Social Physics [63.62824628085961]
軌道予測は多くの分野において広く研究され、多くのモデルベースおよびモデルフリーな手法が研究されている。ニューラル微分方程式モデルに基づく新しい手法を提案する。我々の新しいモデル(ニューラル社会物理学またはNSP)は、学習可能なパラメータを持つ明示的な物理モデルを使用するディープニューラルネットワークである。
論文参考訳（メタデータ） (2022-07-21T12:11:18Z)
Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文参考訳（メタデータ） (2020-12-08T18:03:21Z)
VAE-LIME: Deep Generative Model Based Approach for Local Data-Driven Model Interpretability Applied to the Ironmaking Industry [70.10343492784465]
モデル予測だけでなく、その解釈可能性も、プロセスエンジニアに公開する必要があります。 LIMEに基づくモデルに依存しない局所的解釈可能性ソリューションが最近出現し、元の手法が改良された。本稿では, 燃焼炉で生成する高温金属の温度を推定するデータ駆動型モデルの局所的解釈可能性に関する新しいアプローチ, VAE-LIMEを提案する。
論文参考訳（メタデータ） (2020-07-15T07:07:07Z)
Towards Interpretable Deep Learning Models for Knowledge Tracing [62.75876617721375]
本稿では,深層学習に基づく知識追跡(DLKT)モデルの解釈可能性問題に対処するポストホック手法を提案する。具体的には、RNNに基づくDLKTモデルを解釈するために、レイヤワイズ関連伝搬法(LRP)を適用することに焦点をあてる。実験結果から,DLKTモデルの予測をLRP法で解釈できることを示す。
論文参考訳（メタデータ） (2020-05-13T04:03:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。