論文の概要: On the choice of training data for machine learning of geostrophic
mesoscale turbulence
- arxiv url: http://arxiv.org/abs/2307.00734v1
- Date: Mon, 3 Jul 2023 03:43:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 14:26:22.080601
- Title: On the choice of training data for machine learning of geostrophic
mesoscale turbulence
- Title(参考訳): 地すべり性中規模乱流の機械学習のためのトレーニングデータの選択について
- Authors: F. E. Yan, J. Mak, Y. Wang
- Abstract要約: データ」は、データ駆動手法において中心的な役割を果たすが、機械学習アルゴリズムの研究に焦点をあてることはあまりない。
横境界の存在下での回転成層乱流における渦-平均相互作用について考察する。
- 参考スコア(独自算出の注目度): 0.34376560669160383
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 'Data' plays a central role in data-driven methods, but is not often the
subject of focus in investigations of machine learning algorithms as applied to
Earth System Modeling related problems. Here we consider the case of eddy-mean
interaction in rotating stratified turbulence in the presence of lateral
boundaries, a problem of relevance to ocean modeling, where the eddy fluxes
contain dynamically inert rotational components that are expected to
contaminate the learning process. An often utilized choice in the literature is
to learn from the divergence of the eddy fluxes. Here we provide theoretical
arguments and numerical evidence that learning from the eddy fluxes with the
rotational component appropriately filtered out results in models with
comparable or better skill, but substantially improved robustness. If we simply
want a data-driven model to have predictive skill then the choice of data
choice and/or quality may not be critical, but we argue it is highly desirable
and perhaps even necessary if we want to leverage data-driven methods to aid in
discovering unknown or hidden physical processes within the data itself.
- Abstract(参考訳): データ」はデータ駆動手法において中心的な役割を担っているが、地球システムモデリング関連の問題に適用される機械学習アルゴリズムの研究に焦点をあてることはあまりない。
ここでは, 渦流束が動的に不活性な回転成分を含み, 学習過程を汚染することが期待される海面モデリングの課題である, 横境界の存在下での旋回成層乱流の渦平均相互作用について考察する。
文学においてしばしば用いられる選択は、渦流束の発散から学ぶことである。
ここでは, 回転成分を有する渦流束から学習したモデルが, 同等あるいは優れた性能を持つモデルにおいて, 頑健性が大幅に向上することを示す理論的議論と数値的証拠を提供する。
データ駆動モデルに予測スキルを欲しければ、データ選択や品質の選択は重要ではないかも知れませんが、データ駆動の手法を活用して、データ自体の未知または隠された物理的プロセスの検出を支援したいのであれば、非常に望ましい、あるいは必要かもしれない、と私たちは主張します。
関連論文リスト
- On Inductive Biases for Machine Learning in Data Constrained Settings [0.0]
この論文は、データ制約された設定で表現力のあるモデルを学ぶという問題に対する異なる答えを探求する。
ニューラルネットワークを学ぶために、大きなデータセットに頼るのではなく、データ構造を反映した既知の関数によって、いくつかのモジュールを置き換えるつもりです。
我々のアプローチは「帰納的バイアス」のフードの下に置かれており、これは探索するモデルの空間を制限する手元にあるデータの仮説として定義することができる。
論文 参考訳(メタデータ) (2023-02-21T14:22:01Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Data Models for Dataset Drift Controls in Machine Learning With Optical
Images [8.818468649062932]
主な障害モードは、トレーニングデータとデプロイメントデータの違いによるパフォーマンス低下である。
既存のアプローチでは、関心の対象であるデータ(データ)の明示的なモデルは説明できない。
本研究では、画像データに対してそのようなデータモデルを構築する方法を示し、データセットのドリフトに関連する下流機械学習モデルの性能を制御する。
論文 参考訳(メタデータ) (2022-11-04T16:50:10Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Deep Active Learning with Noise Stability [24.54974925491753]
ラベルのないデータの不確実性推定は、アクティブな学習に不可欠である。
本稿では,雑音の安定性を利用して不確実性を推定する新しいアルゴリズムを提案する。
本手法はコンピュータビジョン,自然言語処理,構造データ解析など,様々なタスクに適用可能である。
論文 参考訳(メタデータ) (2022-05-26T13:21:01Z) - Architectural Optimization and Feature Learning for High-Dimensional
Time Series Datasets [0.7388859384645262]
重力波検出器における過渡ノイズアーチファクトの存在を予測する問題について検討する。
従来の技術と比較して誤差率を60%以上削減するモデルを導入する。
論文 参考訳(メタデータ) (2022-02-27T23:41:23Z) - Deep invariant networks with differentiable augmentation layers [87.22033101185201]
データ拡張ポリシーの学習方法は、保持データを必要とし、二段階最適化の問題に基づいている。
我々のアプローチは、現代の自動データ拡張技術よりも訓練が簡単で高速であることを示す。
論文 参考訳(メタデータ) (2022-02-04T14:12:31Z) - Using Data Assimilation to Train a Hybrid Forecast System that Combines
Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。
動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文 参考訳(メタデータ) (2021-02-15T19:56:48Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。