論文の概要: Simulation as Supervision: Mechanistic Pretraining for Scientific Discovery
- arxiv url: http://arxiv.org/abs/2507.08977v1
- Date: Fri, 11 Jul 2025 19:18:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:22.053928
- Title: Simulation as Supervision: Mechanistic Pretraining for Scientific Discovery
- Title(参考訳): スーパービジョンとしてのシミュレーション:科学発見のためのメカニスティックプレトレーニング
- Authors: Carson Dudley, Reiden Magdaleno, Christopher Harding, Marisa Eisenberg,
- Abstract要約: 本稿では,ニューラルネットワークのトレーニングデータとしてメカニスティックシミュレーションを利用するフレームワークであるSGNNを紹介する。
SGNNは科学の分野やモデリングのタスクにまたがって最先端の結果を達成する。
それらは新しい機械的解釈可能性の形式であるバック・トゥ・シミュレーションの属性を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Scientific modeling faces a core limitation: mechanistic models offer interpretability but collapse under real-world complexity, while machine learning models are flexible but require large labeled datasets, cannot infer unobservable quantities, and operate as black boxes. We introduce Simulation-Grounded Neural Networks (SGNNs), a general framework that uses mechanistic simulations as training data for neural networks. SGNNs are pretrained on synthetic corpora spanning diverse model structures, parameter regimes, stochasticity, and observational artifacts. We evaluated SGNNs across scientific disciplines and modeling tasks, and found that SGNNs achieved state-of-the-art results across settings: for prediction tasks, they nearly tripled COVID-19 forecasting skill versus CDC baselines, reduced chemical yield prediction error by one third, and maintained accuracy in ecological forecasting where task specific models failed. For inference tasks, SGNNs also accurately classified the source of information spread in simulated social networks and enabled supervised learning for unobservable targets, such as estimating COVID-19 transmissibility more accurately than traditional methods even in early outbreaks. Finally, SGNNs enable back-to-simulation attribution, a new form of mechanistic interpretability. Given real world input, SGNNs retrieve simulations based on what the model has learned to see as most similar, revealing which underlying dynamics the model believes are active. This provides process-level insight -- what the model thinks is happening -- not just which features mattered. SGNNs unify scientific theory with deep learning flexibility and unlock a new modeling paradigm -- transforming simulations from rigid, post hoc tools into flexible sources of supervision, enabling robust, interpretable inference even when ground truth is missing.
- Abstract(参考訳): メカニスティックモデルは解釈可能性を提供するが、現実の複雑さの下で崩壊する一方、機械学習モデルは柔軟だがラベル付きデータセットを必要とするため、観測不可能な量を推測できず、ブラックボックスとして動作する。
本稿では,ニューラルネットワークのトレーニングデータとして力学シミュレーションを利用する一般的なフレームワークであるSGNNを紹介する。
SGNNは、様々なモデル構造、パラメータ構造、確率性、観察的アーティファクトにまたがる合成コーパスで事前訓練されている。
その結果、SGNNは、予測タスクにおいて、COVID-19予測スキルとCDCベースラインをほぼ3倍にし、化学生産予測エラーを3分の1減らし、タスク固有のモデルが故障した環境予測における精度を維持した。
推論タスクに関しては、SGNNはシミュレートされたソーシャルネットワークに広がる情報のソースを正確に分類し、早期に発生しても従来の方法よりも正確に新型コロナウイルスの感染率を推定するなど、観察不能な目標に対する教師あり学習を可能にした。
最後に、SGNNは、新しい機械的解釈可能性の形式である、バック・トゥ・シミュレーションの属性を可能にする。
実世界の入力を前提として、SGNNはモデルが学んだことに基づいてシミュレーションを検索し、モデルがどの基盤となるダイナミクスがアクティブであるかを明らかにする。
これにより、どの機能が重要かだけでなく、プロセスレベルの洞察 -- モデルがどのように起きているか -- が提供されます。
SGNNは、科学的理論をディープラーニングの柔軟性と統一し、新しいモデリングパラダイムを解き放ちます -- 厳密でポストホックなツールから柔軟な監視源へと、シミュレーションを変換し、基礎的な真実が欠けている場合でも、堅牢で解釈可能な推論を可能にします。
関連論文リスト
- Harnessing Equivariance: Modeling Turbulence with Graph Neural Networks [0.0]
グラフニューラルネットワーク(GNN)に基づく大規模渦シミュレーション(LES)における乱流モデリングの新しい手法を提案する。
GNNは、ナヴィエ・ストークス方程式の離散回転、反射、翻訳対称性をモデルアーキテクチャに組み込む。
提案手法の適合性について, 均質等方性乱流(HIT)と乱流流の2つの正準試験例について検討した。
論文 参考訳(メタデータ) (2025-04-10T13:37:54Z) - Conservation-informed Graph Learning for Spatiotemporal Dynamics Prediction [84.26340606752763]
本稿では,保護インフォームドGNN(CiGNN)について紹介する。
このネットワークは、保守的かつ非保守的な情報が、潜時的行進戦略によって多次元空間を通過する対称性による一般的な対称性保存則に従うように設計されている。
結果は,CiGNNが顕著なベースライン精度と一般化性を示し,様々な時間的ダイナミクスの予測のための学習に容易に適用可能であることを示した。
論文 参考訳(メタデータ) (2024-12-30T13:55:59Z) - GausSim: Foreseeing Reality by Gaussian Simulator for Elastic Objects [55.02281855589641]
GausSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。
我々は連続体力学を活用し、各カーネルを連続体を表すCenter of Mass System (CMS)として扱う。
さらに、ガウスシムは質量や運動量保存のような明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文 参考訳(メタデータ) (2024-12-23T18:58:17Z) - Physics-Informed Machine Learning for Seismic Response Prediction OF Nonlinear Steel Moment Resisting Frame Structures [6.483318568088176]
PiML法は、非線形構造の地震応答をモデル化するために、科学的原理と物理法則をディープニューラルネットワークに統合する。
運動方程式を操作することは、システムの非線形性を学習し、物理的に解釈可能な結果の中で解を閉じ込めるのに役立つ。
結果、既存の物理誘導LSTMモデルよりも複雑なデータを処理し、他の非物理データ駆動ネットワークより優れている。
論文 参考訳(メタデータ) (2024-02-28T02:16:03Z) - Physics-Informed Neural Networks with Hard Linear Equality Constraints [9.101849365688905]
本研究は,線形等式制約を厳格に保証する物理インフォームドニューラルネットワークKKT-hPINNを提案する。
溶融タンク炉ユニット, 抽出蒸留サブシステム, 化学プラントのアスペンモデル実験により, このモデルが予測精度をさらに高めることを示した。
論文 参考訳(メタデータ) (2024-02-11T17:40:26Z) - Contextualizing MLP-Mixers Spatiotemporally for Urban Data Forecast at Scale [54.15522908057831]
本稿では,STTD予測を大規模に行うためのコンピュータ・ミクサーの適応版を提案する。
我々の結果は、この単純な効率の良いソリューションが、いくつかのトラフィックベンチマークでテストした場合、SOTAベースラインに匹敵する可能性があることを驚くほど示している。
本研究は, 実世界のSTTD予測において, 簡便な有効モデルの探索に寄与する。
論文 参考訳(メタデータ) (2023-07-04T05:19:19Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Learning Stochastic Dynamics with Statistics-Informed Neural Network [0.4297070083645049]
データからダイナミクスを学習するための、統計情報ニューラルネットワーク(SINN)という機械学習フレームワークを導入する。
本研究では,ニューラルネットワークモデルの学習機構を考案し,対象プロセスの正しい統計的挙動を再現する。
得られた低次モデルが時間的に粗い粒度データに基づいて訓練可能であることを示す。
論文 参考訳(メタデータ) (2022-02-24T18:21:01Z) - EINNs: Epidemiologically-Informed Neural Networks [75.34199997857341]
本稿では,疫病予測のための新しい物理インフォームドニューラルネットワークEINNを紹介する。
メカニスティックモデルによって提供される理論的柔軟性と、AIモデルによって提供されるデータ駆動表現性の両方を活用する方法について検討する。
論文 参考訳(メタデータ) (2022-02-21T18:59:03Z) - Leveraging the structure of dynamical systems for data-driven modeling [111.45324708884813]
トレーニングセットとその構造が長期予測の品質に与える影響を考察する。
トレーニングセットのインフォームドデザインは,システムの不変性と基盤となるアトラクションの構造に基づいて,結果のモデルを大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T20:09:20Z) - Hessian-based toolbox for reliable and interpretable machine learning in
physics [58.720142291102135]
本稿では,モデルアーキテクチャの解釈可能性と信頼性,外挿を行うためのツールボックスを提案する。
与えられたテストポイントでの予測に対する入力データの影響、モデル予測の不確実性の推定、およびモデル予測の不可知スコアを提供する。
我々の研究は、物理学やより一般的には科学に適用されたMLにおける解釈可能性と信頼性の方法の体系的利用への道を開く。
論文 参考訳(メタデータ) (2021-08-04T16:32:59Z) - Theory-guided hard constraint projection (HCP): a knowledge-based
data-driven scientific machine learning method [7.778724782015986]
本研究は理論誘導型ハード制約射影(hcp)を提案する。
このモデルは、支配方程式のような物理的な制約を、離散化によって容易に扱える形式に変換する。
理論誘導型HCPの性能は不均一な地下流れ問題に基づく実験により検証した。
論文 参考訳(メタデータ) (2020-12-11T06:17:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。