論文の概要: Designing Accurate Emulators for Scientific Processes using
Calibration-Driven Deep Models
- arxiv url: http://arxiv.org/abs/2005.02328v1
- Date: Tue, 5 May 2020 16:54:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 13:51:37.689434
- Title: Designing Accurate Emulators for Scientific Processes using
Calibration-Driven Deep Models
- Title(参考訳): 校正駆動深部モデルを用いた科学プロセスのための精密エミュレータの設計
- Authors: Jayaraman J. Thiagarajan, Bindya Venkatesh, Rushil Anirudh, Peer-Timo
Bremer, Jim Gaffney, Gemma Anderson, Brian Spears
- Abstract要約: Learn-by-Calibrating (LbC)は、科学応用においてエミュレータを設計するための新しいディープラーニングアプローチである。
また,LbCは広く適応された損失関数の選択に対して,一般化誤差を大幅に改善することを示した。
LbCは、小さなデータレギュレータでも高品質なエミュレータを実現し、さらに重要なことは、明確な事前条件なしで固有のノイズ構造を復元する。
- 参考スコア(独自算出の注目度): 33.935755695805724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predictive models that accurately emulate complex scientific processes can
achieve exponential speed-ups over numerical simulators or experiments, and at
the same time provide surrogates for improving the subsequent analysis.
Consequently, there is a recent surge in utilizing modern machine learning (ML)
methods, such as deep neural networks, to build data-driven emulators. While
the majority of existing efforts has focused on tailoring off-the-shelf ML
solutions to better suit the scientific problem at hand, we study an often
overlooked, yet important, problem of choosing loss functions to measure the
discrepancy between observed data and the predictions from a model. Due to lack
of better priors on the expected residual structure, in practice, simple
choices such as the mean squared error and the mean absolute error are made.
However, the inherent symmetric noise assumption made by these loss functions
makes them inappropriate in cases where the data is heterogeneous or when the
noise distribution is asymmetric. We propose Learn-by-Calibrating (LbC), a
novel deep learning approach based on interval calibration for designing
emulators in scientific applications, that are effective even with
heterogeneous data and are robust to outliers. Using a large suite of
use-cases, we show that LbC provides significant improvements in generalization
error over widely-adopted loss function choices, achieves high-quality
emulators even in small data regimes and more importantly, recovers the
inherent noise structure without any explicit priors.
- Abstract(参考訳): 複雑な科学過程を正確にエミュレートする予測モデルは、数値シミュレータや実験よりも指数的なスピードアップを達成することができる。
その結果、深層ニューラルネットワークのような現代の機械学習(ML)手法を利用してデータ駆動エミュレータを構築するために、近年急増している。
既存の取り組みの大部分は、既定のmlソリューションの調整に重点を置いているが、観測データとモデルからの予測との差異を測定するために損失関数を選択するという、見過ごされがちな、しかし重要な問題について研究している。
予測される残差構造により良い先行性がないため、実際には平均二乗誤差や平均絶対誤差のような単純な選択がなされる。
しかし、これらの損失関数による固有対称ノイズ仮定は、データが不均一である場合やノイズ分布が非対称の場合において不適切である。
本研究では,異種データにおいても有効で,異常値に対して頑健なエミュレータ設計のためのインターバル校正に基づく新しいディープラーニング手法であるlearn-by-calibrating(lbc)を提案する。
大規模なユースケースを用いて,LbCは広義の損失関数選択に対する一般化誤差を大幅に改善し,小規模なデータ構造においても高品質なエミュレータを実現し,さらに重要な点として,明確な事前条件なしに固有雑音構造を復元することを示した。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - An Investigation on Machine Learning Predictive Accuracy Improvement and Uncertainty Reduction using VAE-based Data Augmentation [2.517043342442487]
深層生成学習は、特定のMLモデルを使用して、既存のデータの基盤となる分布を学習し、実際のデータに似た合成サンプルを生成する。
本研究では,変分オートエンコーダ(VAE)を用いた深部生成モデルを用いて,データ拡張の有効性を評価することを目的とする。
本研究では,拡張データを用いてトレーニングしたディープニューラルネットワーク(DNN)モデルの予測において,データ拡張が精度の向上につながるかどうかを検討した。
論文 参考訳(メタデータ) (2024-10-24T18:15:48Z) - Improved Long Short-Term Memory-based Wastewater Treatment Simulators for Deep Reinforcement Learning [0.0]
排水処理データのトレーニングモデルを改善するための2つの手法を実装した。
実験結果から, これらの手法を用いることで, シミュレーションの動作を1年を通して動的時間ワープで改善できることがわかった。
論文 参考訳(メタデータ) (2024-03-22T10:20:09Z) - PETScML: Second-order solvers for training regression problems in Scientific Machine Learning [0.22499166814992438]
近年、分析のためのデータ駆動ツールとして、科学機械学習の出現を目撃している。
我々は、ディープラーニングソフトウェアと従来の機械学習技術とのギャップを埋めるために、Portable and Extensible Toolkit for Scientific計算上に構築されたソフトウェアを紹介します。
論文 参考訳(メタデータ) (2024-03-18T18:59:42Z) - Equation Discovery with Bayesian Spike-and-Slab Priors and Efficient Kernels [57.46832672991433]
ケルネル学習とBayesian Spike-and-Slab pres (KBASS)に基づく新しい方程式探索法を提案する。
カーネルレグレッションを用いてターゲット関数を推定する。これはフレキシブルで表現力があり、データ空間やノイズに対してより堅牢である。
我々は,効率的な後部推論と関数推定のための予測伝搬予測最大化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-09T03:55:09Z) - Fast emulation of density functional theory simulations using
approximate Gaussian processes [0.6445605125467573]
シミュレーション出力を予測する第2の統計モデルは、モデルフィッティング中の完全なシミュレーションの代わりに使用できる。
我々は,観測データを用いた密度汎関数理論(DFT)モデルパラメータのキャリブレーションにエミュレータを用いた。
これらのDFTモデルの有用性は、観測されたデータに基づいて、実験的に観測されていない核種の性質に関する予測を行うことである。
論文 参考訳(メタデータ) (2022-08-24T05:09:36Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Generalization of Neural Combinatorial Solvers Through the Lens of
Adversarial Robustness [68.97830259849086]
ほとんどのデータセットは単純なサブプロブレムのみをキャプチャし、おそらくは突発的な特徴に悩まされる。
本研究では, 局所的な一般化特性である対向ロバスト性について検討し, 厳密でモデル固有な例と突発的な特徴を明らかにする。
他のアプリケーションとは異なり、摂動モデルは知覚できないという主観的な概念に基づいて設計されているため、摂動モデルは効率的かつ健全である。
驚くべきことに、そのような摂動によって、十分に表現力のあるニューラルソルバは、教師あり学習で共通する正確さと悪質さのトレードオフの限界に悩まされない。
論文 参考訳(メタデータ) (2021-10-21T07:28:11Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Fast Distributionally Robust Learning with Variance Reduced Min-Max
Optimization [85.84019017587477]
分散的ロバストな教師付き学習は、現実世界のアプリケーションのための信頼性の高い機械学習システムを構築するための重要なパラダイムとして登場している。
Wasserstein DRSLを解くための既存のアルゴリズムは、複雑なサブプロブレムを解くか、勾配を利用するのに失敗する。
我々はmin-max最適化のレンズを通してwaserstein drslを再検討し、スケーラブルで効率的に実装可能な超勾配アルゴリズムを導出する。
論文 参考訳(メタデータ) (2021-04-27T16:56:09Z) - Transfer learning suppresses simulation bias in predictive models built
from sparse, multi-modal data [15.587831925516957]
科学、工学、ビジネスにおける多くの問題は、ごくわずかな観察に基づく予測を必要とする。
堅牢な予測モデルを構築するには、特に設計空間が多次元である場合、これらのスパースデータをシミュレーションデータで拡張する必要がある。
ディープラーニングの最近の開発を組み合わせて、マルチモーダルデータからより堅牢な予測モデルを構築します。
論文 参考訳(メタデータ) (2021-04-19T23:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。