論文の概要: Integration of Active Learning and MCMC Sampling for Efficient Bayesian Calibration of Mechanical Properties
- arxiv url: http://arxiv.org/abs/2411.13361v1
- Date: Wed, 20 Nov 2024 14:35:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-21 16:10:05.395297
- Title: Integration of Active Learning and MCMC Sampling for Efficient Bayesian Calibration of Mechanical Properties
- Title(参考訳): 機械的特性の効率的なベイズ校正のためのアクティブラーニングとMCMCサンプリングの統合
- Authors: Leon Riccius, Iuri B. C. M. Rocha, Joris Bierkens, Hanne Kekkonen, Frans P. van der Meer,
- Abstract要約: 代理モデルの事前訓練では,低次元から中等次元においても後方推定に大きな誤差が生じることを示した。
本稿では,MCMCアルゴリズムの経路に基づくシンプルな能動学習戦略を提案する。
我々は,フォワードモデルをMCMCアルゴリズムではなく,推論プロセスのボトルネックとみなす。
- 参考スコア(独自算出の注目度): 0.5242869847419834
- License:
- Abstract: Recent advancements in Markov chain Monte Carlo (MCMC) sampling and surrogate modelling have significantly enhanced the feasibility of Bayesian analysis across engineering fields. However, the selection and integration of surrogate models and cutting-edge MCMC algorithms, often depend on ad-hoc decisions. A systematic assessment of their combined influence on analytical accuracy and efficiency is notably lacking. The present work offers a comprehensive comparative study, employing a scalable case study in computational mechanics focused on the inference of spatially varying material parameters, that sheds light on the impact of methodological choices for surrogate modelling and sampling. We show that a priori training of the surrogate model introduces large errors in the posterior estimation even in low to moderate dimensions. We introduce a simple active learning strategy based on the path of the MCMC algorithm that is superior to all a priori trained models, and determine its training data requirements. We demonstrate that the choice of the MCMC algorithm has only a small influence on the amount of training data but no significant influence on the accuracy of the resulting surrogate model. Further, we show that the accuracy of the posterior estimation largely depends on the surrogate model, but not even a tailored surrogate guarantees convergence of the MCMC.Finally, we identify the forward model as the bottleneck in the inference process, not the MCMC algorithm. While related works focus on employing advanced MCMC algorithms, we demonstrate that the training data requirements render the surrogate modelling approach infeasible before the benefits of these gradient-based MCMC algorithms on cheap models can be reaped.
- Abstract(参考訳): マルコフ連鎖モンテカルロ(MCMC)サンプリングと代理モデリングの最近の進歩は、エンジニアリング分野におけるベイズ解析の可能性を大幅に向上させた。
しかし、サロゲートモデルと最先端MCMCアルゴリズムの選択と統合は、しばしばアドホックな決定に依存する。
分析精度と効率性に対するそれらの複合的な影響の体系的な評価は、特に欠落している。
本研究は,空間的に変化する物質パラメータの推測に焦点をあてた,スケーラブルなケーススタディを応用した総合的な比較研究であり,サロゲートモデリングとサンプリングの方法論的選択の影響に光を当てている。
代理モデルの事前訓練では,低次元から中等次元においても後方推定に大きな誤差が生じることを示した。
我々は、MCMCアルゴリズムの経路に基づく単純な能動学習戦略を導入し、事前訓練された全てのモデルよりも優れていることを示し、その訓練データ要求を決定する。
MCMCアルゴリズムの選択は,トレーニングデータの量にはほとんど影響しないが,結果として得られるサロゲートモデルの精度に有意な影響を与えないことを実証する。
さらに, 後続推定の精度はサロゲートモデルに大きく依存しているが, 調整されたサロゲートがMCMCの収束を保証することさえなく, MCMCアルゴリズムではなく, 推論プロセスのボトルネックとしてフォワードモデルを同定する。
関連研究は、高度なMCMCアルゴリズムの採用に重点を置いているが、これらの勾配に基づくMCMCアルゴリズムの安価なモデルに対する利点が取り除かれる前に、トレーニングデータ要求がサロゲートモデリングアプローチを実現することを実証する。
関連論文リスト
- On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.75164588939185]
複数モーダルな)自己教師付き表現学習のための連続領域における識別確率モデル問題について検討する。
我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。
論文 参考訳(メタデータ) (2024-10-11T18:02:46Z) - The Role of Model Architecture and Scale in Predicting Molecular Properties: Insights from Fine-Tuning RoBERTa, BART, and LLaMA [0.0]
本研究では,各種ケミノフォマティクスタスクの微調整におけるLarge Language Models(LLMs)の有効性を比較するための体系的枠組みを提案する。
分子特性を予測するために,RoBERTa,BART,LLaMAの3つのモデルを評価した。
LLaMAベースのモデルは、一般的に最低限のバリデーション損失を提供しており、タスクやスケールの順応性が優れていることを示唆している。
論文 参考訳(メタデータ) (2024-05-02T02:20:12Z) - Enhancing Fairness and Performance in Machine Learning Models: A Multi-Task Learning Approach with Monte-Carlo Dropout and Pareto Optimality [1.5498930424110338]
本研究では,モデル不確実性を利用した機械学習におけるバイアス軽減手法を提案する。
提案手法では,モンテカルロ・ドロップアウト(MC)と組み合わせたマルチタスク学習(MTL)フレームワークを用いて,保護ラベルに関連する予測の不確実性を評価・緩和する。
論文 参考訳(メタデータ) (2024-04-12T04:17:50Z) - Task-optimal data-driven surrogate models for eNMPC via differentiable simulation and optimization [42.72938925647165]
特定の制御タスクにおいて最適な性能を示すために,クープマンシュロゲートモデルのエンドツーエンド学習法を提案する。
我々は,政策最適化を支援するために,力学シミュレーションモデルに基づく環境の潜在的な微分可能性を利用する訓練アルゴリズムを用いる。
論文 参考訳(メタデータ) (2024-03-21T14:28:43Z) - Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - Learning Energy-Based Prior Model with Diffusion-Amortized MCMC [89.95629196907082]
非収束短距離MCMCを用いた事前及び後方サンプリングによる潜時空間EMM学習の一般的な実践は、さらなる進歩を妨げている。
本稿では,MCMCサンプリングのための単純だが効果的な拡散型アモータイズ手法を導入し,それに基づく潜時空間EMMのための新しい学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-05T00:23:34Z) - Data-driven decision-focused surrogate modeling [10.1947610432159]
本稿では,実時間設定における非線形最適化問題の解決を目的とした,意思決定中心の代理モデルの概念を紹介する。
提案したデータ駆動フレームワークは、決定予測エラーを最小限に抑えるためにトレーニングされた、よりシンプルな、例えば凸(convex)、代理最適化モデル(surrogate optimization model)を学ぶことを目指している。
我々は、一般的な非線形化学プロセスの最適化を含む数値実験を通して、我々の枠組みを検証する。
論文 参考訳(メタデータ) (2023-08-23T14:23:26Z) - A Deep Learning Method for Comparing Bayesian Hierarchical Models [1.6736940231069393]
本稿では,任意の階層モデルに対してベイズモデルの比較を行う深層学習手法を提案する。
提案手法は,任意の実データアプリケーションに先立って,後続モデル確率の効率的な再推定と高速な性能検証を可能にする。
論文 参考訳(メタデータ) (2023-01-27T17:27:07Z) - Stochastic Methods for AUC Optimization subject to AUC-based Fairness
Constraints [51.12047280149546]
公正な予測モデルを得るための直接的なアプローチは、公正な制約の下で予測性能を最適化することでモデルを訓練することである。
フェアネスを考慮した機械学習モデルのトレーニング問題を,AUCに基づくフェアネス制約のクラスを対象とする最適化問題として定式化する。
フェアネス測定値の異なる実世界のデータに対するアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-12-23T22:29:08Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - Knowledge Removal in Sampling-based Bayesian Inference [86.14397783398711]
単一のデータ削除要求が来ると、企業は大量のリソースで学んだモデル全体を削除する必要があるかもしれない。
既存の研究は、明示的にパラメータ化されたモデルのためにデータから学んだ知識を取り除く方法を提案する。
本稿では,MCMCのための機械学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-24T10:03:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。