論文の概要: A Probabilistic Framework for LLM-Based Model Discovery
- arxiv url: http://arxiv.org/abs/2602.18266v1
- Date: Fri, 20 Feb 2026 14:49:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.354675
- Title: A Probabilistic Framework for LLM-Based Model Discovery
- Title(参考訳): LLMモデル探索のための確率的フレームワーク
- Authors: Stefan Wahl, Raphaela Schenk, Ali Farnoud, Jakob H. Macke, Daniel Gedon,
- Abstract要約: 我々はモデル発見を確率論的推論、すなわち未知分布からのサンプリングとして再考する。
本稿では,Sequential Monte Carlo サンプリングに基づくアルゴリズム ModelSMC を紹介する。
- 参考スコア(独自算出の注目度): 12.785456590282726
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated methods for discovering mechanistic simulator models from observational data offer a promising path toward accelerating scientific progress. Such methods often take the form of agentic-style iterative workflows that repeatedly propose and revise candidate models by imitating human discovery processes. However, existing LLM-based approaches typically implement such workflows via hand-crafted heuristic procedures, without an explicit probabilistic formulation. We recast model discovery as probabilistic inference, i.e., as sampling from an unknown distribution over mechanistic models capable of explaining the data. This perspective provides a unified way to reason about model proposal, refinement, and selection within a single inference framework. As a concrete instantiation of this view, we introduce ModelSMC, an algorithm based on Sequential Monte Carlo sampling. ModelSMC represents candidate models as particles which are iteratively proposed and refined by an LLM, and weighted using likelihood-based criteria. Experiments on real-world scientific systems illustrate that this formulation discovers models with interpretable mechanisms and improves posterior predictive checks. More broadly, this perspective provides a probabilistic lens for understanding and developing LLM-based approaches to model discovery.
- Abstract(参考訳): 観測データからメカニスティック・シミュレーターモデルを発見する自動化手法は、科学的な進歩を加速するための有望な道筋を提供する。
このような手法は、人間の発見過程を模倣して候補モデルを繰り返し提案し、修正するエージェントスタイルの反復ワークフローの形式をとることが多い。
しかし、既存のLLMベースのアプローチは、通常、明示的な確率的定式化なしに手作りのヒューリスティックな手順でそのようなワークフローを実装している。
我々は、モデル発見を確率論的推論、すなわち、そのデータを説明可能な力学モデル上の未知の分布からサンプリングするものとして再考する。
この観点は、単一の推論フレームワーク内でモデルの提案、洗練、選択について、統一された方法を提供します。
この視点の具体的インスタンス化として,Sequential Monte Carlo サンプリングに基づくアルゴリズム ModelSMC を導入する。
ModelSMCは、LLMによって反復的に提案され、精製され、可能性に基づく基準を用いて重み付けされた粒子として候補モデルを表す。
実世界の科学システムに関する実験では、この定式化が解釈可能なメカニズムを持つモデルを発見し、後部予測チェックを改善することが示されている。
より広範に、この視点は、モデル発見に対するLLMベースのアプローチを理解し、開発するための確率レンズを提供する。
関連論文リスト
- Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。
本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。
RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文 参考訳(メタデータ) (2025-09-29T01:40:26Z) - FBMS: An R Package for Flexible Bayesian Model Selection and Model Averaging [14.487258585834374]
FBMSパッケージは、効率的なMode Jumping Markov Chain Monte Carlo (MJMCMC)アルゴリズムを実装している。
この枠組みの中で、アルゴリズムは変換された特徴の集団を維持・更新し、その後部確率を計算し、それらから構築されたモデルの後部確率を評価する。
ガウス回帰における推論モデルと予測モデルの両方にFBMSを効果的に利用することを示し、BGNLMモデルの異なるインスタンスに着目した。
論文 参考訳(メタデータ) (2025-08-31T09:04:01Z) - Modeling and Discovering Direct Causes for Predictive Models [0.0]
本稿では,予測モデルの入出力挙動を捉える因果モデリングフレームワークを提案する。
そして、いくつかの仮定の下で(データから)直接原因を発見するための、健全で完全なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-03T22:25:42Z) - Supervised Score-Based Modeling by Gradient Boosting [49.556736252628745]
本稿では,スコアマッチングを組み合わせた勾配向上アルゴリズムとして,SSM(Supervised Score-based Model)を提案する。
推測時間と予測精度のバランスをとるため,SSMの学習とサンプリングに関する理論的解析を行った。
我々のモデルは、精度と推測時間の両方で既存のモデルより優れています。
論文 参考訳(メタデータ) (2024-11-02T07:06:53Z) - Linear Noise Approximation Assisted Bayesian Inference on Mechanistic Model of Partially Observed Stochastic Reaction Network [2.325005809983534]
本稿では、部分的に観察された酵素反応ネットワーク(SRN)に対する効率的なベイズ推論手法を開発する。
線形雑音近似(LNA)メタモデルを提案する。
マルコフ・チェイン・モンテカルロの収束を高速化するために、導出確率の勾配を利用して効率的な後方サンプリング手法を開発した。
論文 参考訳(メタデータ) (2024-05-05T01:54:21Z) - Fusion of Gaussian Processes Predictions with Monte Carlo Sampling [61.31380086717422]
科学と工学において、私たちはしばしば興味のある変数の正確な予測のために設計されたモデルで作業します。
これらのモデルが現実の近似であることを認識し、複数のモデルを同じデータに適用し、結果を統合することが望ましい。
論文 参考訳(メタデータ) (2024-03-03T04:21:21Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z) - Macroscopic Traffic Flow Modeling with Physics Regularized Gaussian
Process: Generalized Formulations [5.827236278192557]
本研究では,物理正規化ガウス過程(PRGP)という新しいモデリングフレームワークを提案する。
この新しいアプローチは、物理モデル、すなわち古典的なトラフィックフローモデルをガウスのプロセスアーキテクチャにエンコードし、機械学習のトレーニングプロセスを規則化する。
提案手法の有効性を証明するため,ユタ州I-15高速道路から収集した実世界のデータセットについて実験的検討を行った。
論文 参考訳(メタデータ) (2020-07-14T17:27:23Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。