Fugu-MT 論文翻訳(概要): Distilling Machine Learning's Added Value: Pareto Fronts in Atmospheric Applications

論文の概要: Distilling Machine Learning's Added Value: Pareto Fronts in Atmospheric Applications

arxiv url: http://arxiv.org/abs/2408.02161v1
Date: Sun, 4 Aug 2024 23:05:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-06 14:56:07.363262
Title: Distilling Machine Learning's Added Value: Pareto Fronts in Atmospheric Applications
Title（参考訳）: 機械学習の付加価値を蒸留する - 大気アプリケーションにおけるParetoフロントエンド
Authors: Tom Beucler, Arthur Grundner, Sara Shamekh, Peter Ukkonen, Matthew Chantry, Ryan Lagerquist,
Abstract要約: 気候モデル階層に着想を得て,適切に決定された誤差・複雑度平面内で定義されたパレート最適モデルの完全な階層構造が,モデル開発をガイドし,モデルの付加価値を理解するのに役立つことを提案する。大気物理学におけるパレートフロントの利用を3つのサンプルアプリケーションを用いて実証し、最小のチューナブルパラメータを持つ半経験的モデル(単純)からディープラーニングアルゴリズム(最も複雑)までの階層性を示した。
参考スコア（独自算出の注目度）: 0.3696370044051793
License: http://creativecommons.org/licenses/by/4.0/
Abstract: While the added value of machine learning (ML) for weather and climate applications is measurable, explaining it remains challenging, especially for large deep learning models. Inspired by climate model hierarchies, we propose that a full hierarchy of Pareto-optimal models, defined within an appropriately determined error-complexity plane, can guide model development and help understand the models' added value. We demonstrate the use of Pareto fronts in atmospheric physics through three sample applications, with hierarchies ranging from semi-empirical models with minimal tunable parameters (simplest) to deep learning algorithms (most complex). First, in cloud cover parameterization, we find that neural networks identify nonlinear relationships between cloud cover and its thermodynamic environment, and assimilate previously neglected features such as vertical gradients in relative humidity that improve the representation of low cloud cover. This added value is condensed into a ten-parameter equation that rivals the performance of deep learning models. Second, we establish a ML model hierarchy for emulating shortwave radiative transfer, distilling the importance of bidirectional vertical connectivity for accurately representing absorption and scattering, especially for multiple cloud layers. Third, we emphasize the importance of convective organization information when modeling the relationship between tropical precipitation and its surrounding environment. We discuss the added value of temporal memory when high-resolution spatial information is unavailable, with implications for precipitation parameterization. Therefore, by comparing data-driven models directly with existing schemes using Pareto optimality, we promote process understanding by hierarchically unveiling system complexity, with the hope of improving the trustworthiness of ML models in atmospheric applications.
Abstract（参考訳）: 天気や気候のアプリケーションに機械学習(ML)を追加する価値は測定可能であるが、特に大規模なディープラーニングモデルでは、依然として困難である。気候モデル階層に着想を得て,適切に決定された誤差・複雑度平面内で定義されたパレート最適モデルの完全な階層構造が,モデル開発をガイドし,モデルの付加価値を理解するのに役立つことを提案する。大気物理におけるParetoフロントの利用を3つのサンプルアプリケーションを用いて実証し、最小のチューナブルパラメータを持つ半経験的モデル(単純)からディープラーニングアルゴリズム(最も複雑)まで様々に階層化を行った。まず、雲被覆パラメータ化において、ニューラルネットワークが雲被覆と熱力学環境の間の非線形関係を識別し、雲被覆の表現を改善する相対湿度の垂直勾配のような従来無視されていた特徴を同化することを発見した。この付加値は、ディープラーニングモデルの性能に匹敵する10パラメータの方程式に凝縮される。第2に、短波放射伝達をエミュレートするMLモデル階層を構築し、特に複数の雲層において、吸収と散乱を正確に表現するための双方向垂直接続の重要性を蒸留する。第3に,熱帯降雨と周辺環境の関係をモデル化する上で,対流組織情報の重要性を強調した。本研究では,高分解能空間情報が利用できない場合の時間記憶の付加値について考察する。そこで,Paretoの最適性を用いて,データ駆動モデルと既存のスキームを直接比較することにより,階層的にシステム複雑性を明らかにするプロセス理解を促進し,大気アプリケーションにおけるMLモデルの信頼性向上を期待する。

関連論文リスト

Transfer Learning for High-dimensional Reduced Rank Time Series Models [0.0]
時間的依存とより複雑なモデルパラメータ構造を持つ観測系列の転送学習に焦点をあてる。本稿では,低ランク・スパース構造を特徴とする高次元VARモデルの推定に適した新しい移動学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-04-22T08:15:59Z)
Prithvi WxC: Foundation Model for Weather and Climate [2.9230020115516253]
Prithvi WxCは、Modern-Era Retrospective Analysis for Research and Applications, Version 2 (MERRA-2)から160変数を用いて開発された23億のパラメータ基盤モデルである。このモデルは、異なる位相の気象現象を微細な解像度でモデル化するために、大きなトークン数に対応できるように設計されている。本稿では, 自動回帰ロールアウト予測, ダウンスケーリング, 重力波フラックスパラメータ化, エクストリームイベント推定など, 課題のある下流タスクのセットでモデルを検証する。
論文参考訳（メタデータ） (2024-09-20T15:53:17Z)
SMILE: Zero-Shot Sparse Mixture of Low-Rank Experts Construction From Pre-Trained Foundation Models [85.67096251281191]
我々は、ゼロショットスパースミクチャー(SMILE)と呼ばれるモデル融合に対する革新的なアプローチを提案する。 SMILEは、余分なデータやさらなるトレーニングなしに、ソースモデルをMoEモデルにアップスケーリングできる。画像分類やテキスト生成タスクなど,さまざまなシナリオに対して,フル微調整とLoRA微調整を用いて広範な実験を行う。
論文参考訳（メタデータ） (2024-08-19T17:32:15Z)
KFD-NeRF: Rethinking Dynamic NeRF with Kalman Filter [49.85369344101118]
KFD-NeRFは,Kalmanフィルタに基づく効率的かつ高品質な運動再構成フレームワークと統合された,新しい動的ニューラル放射場である。我々のキーとなる考え方は、動的放射場を、観測と予測という2つの知識源に基づいて時間的に異なる状態が推定される動的システムとしてモデル化することである。我々のKFD-NeRFは、同等の計算時間と最先端の視線合成性能で、徹底的な訓練を施した類似または優れた性能を示す。
論文参考訳（メタデータ） (2024-07-18T05:48:24Z)
Physics-Informed Machine Learning Towards A Real-Time Spacecraft Thermal Simulator [15.313871831214902]
ここで提示されるPIMLモデルまたはハイブリッドモデルは、軌道上の熱負荷条件によって与えられるノイズの低減を予測するニューラルネットワークで構成されている。我々は,ハイブリッドモデルの計算性能と精度を,データ駆動型ニューラルネットモデルと,地球周回小型宇宙船の高忠実度有限差分モデルと比較した。 PIMLベースのアクティブノダライゼーションアプローチは、ニューラルネットワークモデルや粗いメッシュモデルよりもはるかに優れた一般化を提供すると同時に、高忠実度モデルと比較して計算コストを最大1.7倍削減する。
論文参考訳（メタデータ） (2024-07-08T16:38:52Z)
Towards Robust and Efficient Cloud-Edge Elastic Model Adaptation via Selective Entropy Distillation [56.79064699832383]
Cloud-Edge Elastic Model Adaptation (CEMA)パラダイムを確立し、エッジモデルが前方伝播のみを実行するようにします。 CEMAでは,通信負担を軽減するため,不要なサンプルをクラウドにアップロードすることを避けるための2つの基準を考案した。
論文参考訳（メタデータ） (2024-02-27T08:47:19Z)
Bidirectional Knowledge Reconfiguration for Lightweight Point Cloud Analysis [74.00441177577295]
ポイントクラウド分析は計算システムのオーバーヘッドに直面し、モバイルやエッジデバイスでの利用を制限する。本稿では,軽量点雲モデルのための特徴蒸留について検討する。本研究では,教師から生徒への情報的文脈的知識を抽出するための双方向知識再構成を提案する。
論文参考訳（メタデータ） (2023-10-08T11:32:50Z)
Automatic Parameterization for Aerodynamic Shape Optimization via Deep Geometric Learning [60.69217130006758]
空力形状最適化のための形状パラメータ化を完全に自動化する2つの深層学習モデルを提案する。どちらのモデルも、深い幾何学的学習を通じてパラメータ化し、人間の事前知識を学習された幾何学的パターンに埋め込むように最適化されている。 2次元翼の形状最適化実験を行い、2つのモデルに適用可能なシナリオについて論じる。
論文参考訳（メタデータ） (2023-05-03T13:45:40Z)
ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。気候データセットの自己教師型学習目標で事前トレーニングすることができる。気候や気候の様々な問題に対処するために、微調整が可能である。
論文参考訳（メタデータ） (2023-01-24T23:19:01Z)
Learning Low-Dimensional Quadratic-Embeddings of High-Fidelity Nonlinear Dynamics using Deep Learning [9.36739413306697]
データから動的モデルを学ぶことは、エンジニアリング設計、最適化、予測において重要な役割を果たす。深層学習を用いて高忠実度力学系に対する低次元埋め込みを同定する。
論文参考訳（メタデータ） (2021-11-25T10:09:00Z)
Investigating the Relationship Between Dropout Regularization and Model Complexity in Neural Networks [0.0]
ドロップアウト規則化は、ディープラーニングモデルのばらつきを低減するのに役立つ。 2,000のニューラルネットワークをトレーニングすることにより,ドロップアウト率とモデル複雑性の関係について検討する。各密層に隠されたユニットの数から、最適なドロップアウト率を予測するニューラルネットワークを構築します。
論文参考訳（メタデータ） (2021-08-14T23:49:33Z)
TCL: Transformer-based Dynamic Graph Modelling via Contrastive Learning [87.38675639186405]
我々は,動的に進化するグラフを連続的に扱う,TCLと呼ばれる新しいグラフニューラルネットワークアプローチを提案する。我々の知る限りでは、これは動的グラフ上の表現学習にコントラスト学習を適用する最初の試みである。
論文参考訳（メタデータ） (2021-05-17T15:33:25Z)
Numerical Weather Forecasting using Convolutional-LSTM with Attention and Context Matcher Mechanisms [10.759556555869798]
本稿では,高解像度気象データを予測するための新しいディープラーニングアーキテクチャを提案する。我々の気象モデルは,ベースラインの深層学習モデルと比較して,大幅な性能向上を実現している。
論文参考訳（メタデータ） (2021-02-01T08:30:42Z)
Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文参考訳（メタデータ） (2020-04-08T09:07:11Z)
Hybrid modeling: Applications in real-time diagnosis [64.5040763067757]
我々は、機械学習にインスパイアされたモデルと物理モデルを組み合わせた、新しいハイブリッドモデリングアプローチの概要を述べる。このようなモデルをリアルタイム診断に利用しています。
論文参考訳（メタデータ） (2020-03-04T00:44:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。