論文の概要: Agentic Scientific Simulation: Execution-Grounded Model Construction and Reconstruction
- arxiv url: http://arxiv.org/abs/2603.00214v1
- Date: Fri, 27 Feb 2026 15:42:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.112871
- Title: Agentic Scientific Simulation: Execution-Grounded Model Construction and Reconstruction
- Title(参考訳): エージェント科学シミュレーション:実行環境モデルの構築と再構築
- Authors: Knut-Andreas Lie, Olav Møyner, Elling Svee, Jakob Torben,
- Abstract要約: そこで本研究では,モデル構築をインタプリタ-アクト-バリデートループとして構成するエージェント科学シミュレーションについて検討する。
完全に微分可能なJuliaベースの貯水池シミュレータJutulDarcyをベースとした参照実装JutulGPTを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM agents are increasingly used for code generation, but physics-based simulation poses a deeper challenge: natural-language descriptions of simulation models are inherently underspecified, and different admissible resolutions of implicit choices produce physically valid but scientifically distinct configurations. Without explicit detection and resolution of these ambiguities, neither the correctness of the result nor its reproducibility from the original description can be assured. This paper investigates agentic scientific simulation, where model construction is organized as an execution-grounded interpret-act-validate loop and the simulator serves as the authoritative arbiter of physical validity rather than merely a runtime. We present JutulGPT, a reference implementation built on the fully differentiable Julia-based reservoir simulator JutulDarcy. The agent combines structured retrieval of documentation and examples with code synthesis, static analysis, execution, and systematic interpretation of solver diagnostics. Underspecified modelling choices are detected explicitly and resolved either autonomously (with logged assumptions) or through targeted user queries. The results demonstrate that agent-mediated model construction can be grounded in simulator validation, while also revealing a structural limitation: choices resolved tacitly through simulator defaults are invisible to the assumption log and to any downstream representation. A secondary experiment with autonomous reconstruction of a reference model from progressively abstract textual descriptions shows that reconstruction variability exposes latent degrees of freedom in simulation descriptions and provides a practical methodology for auditing reproducibility. All code, prompts, and agent logs are publicly available.
- Abstract(参考訳): LLMエージェントはコード生成にますます使われているが、物理に基づくシミュレーションはより深い課題を生んでいる: シミュレーションモデルの自然言語による記述は本質的には不明確であり、暗黙的な選択の許容可能な解決は物理的に有効だが科学的に異なる構成を生成する。
これらの曖昧さの明示的な検出と解決がなければ、結果の正しさも元の記述からの再現性も保証できない。
本稿では,モデル構築が実行基底の解釈-アクト-バリデートループとして構成され,シミュレータが単に実行時ではなく物理的妥当性のオービタとして機能するエージェント科学シミュレーションについて検討する。
完全に微分可能なJuliaベースの貯水池シミュレータJutulDarcyをベースとした参照実装JutulGPTを提案する。
このエージェントは、ドキュメンテーションと例の構造的検索と、コード合成、静的解析、実行、および解決者診断の体系的解釈を組み合わせる。
未特定なモデリング選択は明示的に検出され、(ログ化された仮定で)自律的に、あるいはターゲットとするユーザクエリによって解決される。
その結果、エージェントを介するモデル構築は、シミュレータ検証に基礎を置くことができ、また、構造的制限も示している:シミュレータのデフォルトによって解決された選択は、仮定ログやダウンストリーム表現には見えない。
段階的に抽象的なテキスト記述から参照モデルの自律的再構築を行う二次実験により、再現性はシミュレーション記述において潜在的な自由度を露呈し、再現性を監査するための実践的な方法論を提供する。
すべてのコード、プロンプト、エージェントログが公開されている。
関連論文リスト
- Rethinking Scientific Modeling: Toward Physically Consistent and Simulation-Executable Programmatic Generation [8.067859101380389]
非実行可能または物理的に一貫性のない出力は、厳密な工学的制約の下では依然として一般的である。
物理に一貫性のある自動建築モデリングのための枠組みを提案する。
CivilInstructは、構造工学の知識と制約推論を形式化するドメイン固有のデータセットとして導入された。
MBEvalは、実行可能性と構造的ダイナミクスの一貫性を評価する検証駆動ベンチマークとして提示される。
論文 参考訳(メタデータ) (2026-02-06T06:57:04Z) - Multi-Agent Procedural Graph Extraction with Structural and Logical Refinement [66.51979814832332]
モデル式は、専用の構造的および論理的洗練を伴う多ラウンド推論プロセスとして手続きグラフ抽出を定式化する。
実験により、モデルが強いベースラインに対して構造的正当性と論理的整合性の両方において大幅に改善されることが示されている。
論文 参考訳(メタデータ) (2026-01-27T04:00:48Z) - SimBench: Benchmarking the Ability of Large Language Models to Simulate Human Behaviors [58.87134689752605]
我々は,LLMシミュレーションの堅牢で再現可能な科学のための,最初の大規模標準ベンチマークであるSimBenchを紹介する。
現在、最高のLLMでさえシミュレーション能力が限られ(スコア: 40.80/100)、性能はモデルサイズと対数的にスケールする。
シミュレーション能力は、深い知識集約的推論と最も強く相関していることを示す。
論文 参考訳(メタデータ) (2025-10-20T13:14:38Z) - G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration [48.948187359727996]
G-Simは、厳密な経験的校正によるシミュレータ構築を自動化するハイブリッドフレームワークである。
信頼性のある因果的インフォームドシミュレータを生成し、データ効率を軽減し、堅牢なシステムレベルの介入を可能にする。
論文 参考訳(メタデータ) (2025-06-10T22:14:34Z) - Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - GausSim: Foreseeing Reality by Gaussian Simulator for Elastic Objects [55.02281855589641]
GausSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。
我々は連続体力学を活用し、各カーネルを連続体を表すCenter of Mass System (CMS)として扱う。
さらに、ガウスシムは質量や運動量保存のような明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文 参考訳(メタデータ) (2024-12-23T18:58:17Z) - Bisimulation Learning [55.859538562698496]
我々は、大きな、潜在的に無限の状態空間を持つ状態遷移系の有限バイシミュレートを計算する。
提案手法は,実際に行われている他の最先端ツールよりも高速な検証結果が得られる。
論文 参考訳(メタデータ) (2024-05-24T17:11:27Z) - All-in-one simulation-based inference [19.41881319338419]
我々は、現在の制限を克服する新しい償却推論手法、Simformerを提案する。
Simformerは、ベンチマークタスクにおける現在の最先端の償却推論アプローチより優れています。
関数値パラメータを持つモデルに適用することができ、欠落または非構造化データによる推論シナリオを処理でき、パラメータとデータの合同分布の任意の条件をサンプリングすることができる。
論文 参考訳(メタデータ) (2024-04-15T10:12:33Z) - Informal Safety Guarantees for Simulated Optimizers Through
Extrapolation from Partial Simulations [0.0]
自己教師付き学習は、最先端の言語モデリングのバックボーンである。
自己教師付きデータセットにおける予測損失を伴うトレーニングはシミュレータを引き起こすと論じられている。
論文 参考訳(メタデータ) (2023-11-29T09:32:56Z) - DeforestVis: Behavior Analysis of Machine Learning Models with Surrogate Decision Stumps [46.58231605323107]
複雑なMLモデルの振る舞いを要約する視覚解析ツールであるDeforestVisを提案する。
DeforestVisは、より多くの切り株をインクリメンタルに生成することで、複雑さとフィデリティのトレードオフを探索するのに役立つ。
DeforestVisの適用性と有用性について,2つのユースケースと,データアナリストとモデル開発者とのエキスパートインタビューで紹介する。
論文 参考訳(メタデータ) (2023-03-31T21:17:15Z) - DISCO: Double Likelihood-free Inference Stochastic Control [29.84276469617019]
確率自由推論のためのベイズ統計学における現代シミュレータのパワーと最近の技術を活用することを提案する。
シミュレーションパラメータの後方分布は、システムの潜在的非解析モデルによって伝播される。
実験により、制御器の提案により、古典的な制御やロボット工学のタスクにおいて、優れた性能と堅牢性が得られることが示された。
論文 参考訳(メタデータ) (2020-02-18T05:29:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。