論文の概要: Bayesian Surrogate Training on Multiple Data Sources: A Hybrid Modeling Strategy
- arxiv url: http://arxiv.org/abs/2412.11875v1
- Date: Mon, 16 Dec 2024 15:27:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 14:01:16.749256
- Title: Bayesian Surrogate Training on Multiple Data Sources: A Hybrid Modeling Strategy
- Title(参考訳): Bayesian Surrogate Training on Multiple Data Sources: A Hybrid Modeling Strategy
- Authors: Philipp Reiser, Paul-Christian Bürkner, Anneli Guthke,
- Abstract要約: 代理訓練中にシミュレーションデータと実世界の計測データを統合するための2つの新しい手法を提案する。
第1の方法は、各データソースに対するサロゲートモデルを訓練し、予測分布を組み合わせ、第2の方法は、単一のサロゲートをトレーニングすることで、両方のデータソースを組み込む。
- 参考スコア(独自算出の注目度): 1.2435663633224636
- License:
- Abstract: Surrogate models are often used as computationally efficient approximations to complex simulation models, enabling tasks such as solving inverse problems, sensitivity analysis, and probabilistic forward predictions, which would otherwise be computationally infeasible. During training, surrogate parameters are fitted such that the surrogate reproduces the simulation model's outputs as closely as possible. However, the simulation model itself is merely a simplification of the real-world system, often missing relevant processes or suffering from misspecifications e.g., in inputs or boundary conditions. Hints about these might be captured in real-world measurement data, and yet, we typically ignore those hints during surrogate building. In this paper, we propose two novel probabilistic approaches to integrate simulation data and real-world measurement data during surrogate training. The first method trains separate surrogate models for each data source and combines their predictive distributions, while the second incorporates both data sources by training a single surrogate. We show the conceptual differences and benefits of the two approaches through both synthetic and real-world case studies. The results demonstrate the potential of these methods to improve predictive accuracy, predictive coverage, and to diagnose problems in the underlying simulation model. These insights can improve system understanding and future model development.
- Abstract(参考訳): 代理モデルは複雑なシミュレーションモデルに対する計算効率のよい近似としてよく用いられ、逆問題、感度解析、確率論的前方予測などのタスクが計算的に実現不可能である。
トレーニング中、シュロゲートパラメータは、シュロゲートが可能な限りシミュレーションモデルの出力を再現するように取り付けられる。
しかし、シミュレーションモデル自体が現実のシステムの単純化であり、しばしば関連するプロセスが欠落したり、入力や境界条件の誤特定に悩まされたりする。
これらのヒントは現実世界の観測データに記録されるかもしれませんが、サロゲートビルディングでは通常これらのヒントを無視します。
本稿では,サロゲートトレーニング中のシミュレーションデータと実世界の計測データを統合するための2つの新しい確率的アプローチを提案する。
第1の方法は、各データソースに対するサロゲートモデルを訓練し、予測分布を組み合わせ、第2の方法は、単一のサロゲートをトレーニングすることで、両方のデータソースを組み込む。
本研究は, 実世界のケーススタディと実世界のケーススタディの両方を通して, 2つのアプローチの概念的差異と利点を示す。
その結果, これらの手法が予測精度, 予測範囲を向上し, 基礎となるシミュレーションモデルにおける問題を診断する可能性を示した。
これらの洞察は、システム理解と将来のモデル開発を改善することができる。
関連論文リスト
- On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - Amortized Probabilistic Conditioning for Optimization, Simulation and Inference [20.314865219675056]
Amortized Conditioning Engine (ACE)
興味のある潜伏変数を明示的に表現するトランスフォーマーベースのメタラーニングモデル。
ACEは、観測されたデータと解釈可能な潜伏変数の両方、実行時のプリエントを含めることができ、離散的かつ連続的なデータと潜伏変数の予測分布を出力する。
論文 参考訳(メタデータ) (2024-10-20T07:22:54Z) - All-in-one simulation-based inference [19.41881319338419]
我々は、現在の制限を克服する新しい償却推論手法、Simformerを提案する。
Simformerは、ベンチマークタスクにおける現在の最先端の償却推論アプローチより優れています。
関数値パラメータを持つモデルに適用することができ、欠落または非構造化データによる推論シナリオを処理でき、パラメータとデータの合同分布の任意の条件をサンプリングすることができる。
論文 参考訳(メタデータ) (2024-04-15T10:12:33Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Efficient Learning of Accurate Surrogates for Simulations of Complex Systems [0.0]
サンプリング駆動サンプリングによって強化されたオンライン学習手法を提案する。
モデル応答面上のすべての旋回点がトレーニングデータに含まれることを保証する。
本手法を核物質のシミュレーションに適用し,高精度なサロゲートを確実に自動生成できることを実証する。
論文 参考訳(メタデータ) (2022-07-11T20:51:11Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Transfer learning suppresses simulation bias in predictive models built
from sparse, multi-modal data [15.587831925516957]
科学、工学、ビジネスにおける多くの問題は、ごくわずかな観察に基づく予測を必要とする。
堅牢な予測モデルを構築するには、特に設計空間が多次元である場合、これらのスパースデータをシミュレーションデータで拡張する必要がある。
ディープラーニングの最近の開発を組み合わせて、マルチモーダルデータからより堅牢な予測モデルを構築します。
論文 参考訳(メタデータ) (2021-04-19T23:28:32Z) - Using Data Assimilation to Train a Hybrid Forecast System that Combines
Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。
動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文 参考訳(メタデータ) (2021-02-15T19:56:48Z) - Model-based Policy Optimization with Unsupervised Model Adaptation [37.09948645461043]
本研究では,不正確なモデル推定による実データとシミュレーションデータのギャップを埋めて,より良いポリシ最適化を実現する方法について検討する。
本稿では,教師なしモデル適応を導入したモデルベース強化学習フレームワークAMPOを提案する。
提案手法は,一連の連続制御ベンチマークタスクにおけるサンプル効率の観点から,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-10-19T14:19:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。