Fugu-MT 論文翻訳(概要): SIGA: Self-Evolving Coding-Agent Adapters for Scientific Simulation

論文の概要: SIGA: Self-Evolving Coding-Agent Adapters for Scientific Simulation

arxiv url: http://arxiv.org/abs/2606.09774v1
Date: Mon, 08 Jun 2026 17:35:17 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-09 14:42:07.597239
Title: SIGA: Self-Evolving Coding-Agent Adapters for Scientific Simulation
Title（参考訳）: SIGA:科学シミュレーションのための自己進化型符号化アルゴリズム
Authors: Matthew Ho, Brian Liu, Jixuan Chen, Audrey Wang, Lianhui Qin,
Abstract要約: グラウンディング層は、一般的なコーディングエージェントを科学ソフトウェアの実用的なオペレータに変えることができる。我々は主に、地下科学で使用されるオープンソースのマルチ物理シミュレータGEOS上でSIGAを評価した。その結果、軽量で自己改善可能な接地層は、一般的なコーディングエージェントを実用的な演算子に変えることが示唆された。
参考スコア（独自算出の注目度）: 7.740751206694116
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Advanced scientific simulators expose specialized input languages that turn simulation goals into executable configurations, but learning them can cost domain scientists hours to days. We study simulator setup as a problem of agent-tool interface grounding: what minimal simulator-specific adaptations are needed for an off-the-shelf coding agent to operate real scientific software? Our intuition is that coding agents already know how to navigate files, edit code, run commands, and repair outputs, but they lack the simulator's executable contract: its vocabulary, structural constraints, validation rules, and termination conditions. We introduce SIGA, a Simulator-Interface Grounding Adapter that supplies this contract through retrieval, procedural memory, in-trajectory validation, and validation-enforced termination. We primarily evaluate SIGA on GEOS, an open-source multiphysics simulator used in subsurface science. SIGA produces a complete GEOS deck in about five minutes with TreeSim above 0.90, matching an extended-budget human expert who took about three hours, a roughly 36x wall-clock speedup. On a harder held-out set, grounding raises TreeSim from 0.720 to 0.789, a roughly 10% relative gain over the bare agent, and can reduce the across-seed standard deviation by 16x. Self-evolution further improves SIGA by rewriting adapter contents from prior trajectories, yielding the highest held-out GEOS mean and matching or outperforming the strongest hand-designed configuration. Transfers to OpenFOAM and LAMMPS show that the dominant mechanism shifts by interface: validation matters most when structural completeness is the bottleneck, while memory and retrieval matter most when domain correctness is the bottleneck. These results suggest that lightweight, self-improvable grounding layers can turn general coding agents into practical operators of scientific software.
Abstract（参考訳）: 高度な科学シミュレーターは、シミュレーション目標を実行可能な構成に変換する特殊な入力言語を公開するが、それを学習することはドメイン科学者に数時間から数日かかる可能性がある。実科学ソフトウェアを運用するためには,シミュレータ固有の最小限の適応が必要か? 私たちの直感では、コーディングエージェントはすでにファイルのナビゲート、コード編集、コマンドの実行、出力の修正を知っていますが、シミュレータの実行可能なコントラクト(語彙、構造的制約、バリデーションルール、終了条件)が欠如しています。 SIGA(Simulator-Interface Grounding Adapter)は,検索,手続き記憶,軌道内検証,検証強化終了などを通じて,この契約を実現する。我々は主に、地下科学で使用されるオープンソースのマルチ物理シミュレータGEOS上でSIGAを評価した。 SIGAはGEOSの完全なデッキを約5分で製造し、TreeSimは0.90を超える。堅固なホールドアウトセットでは、接地によってTreeSimが0.720から0.789に上昇し、ベアエージェントに対して約10%の相対的な利得となり、全種間の標準偏差を16倍に低減することができる。自己進化は、アダプタコンテンツを事前の軌跡から書き換えることによりSIGAをさらに改善し、最高保持率のGEOS平均値を得るとともに、最強の手設計構成に適合または優れる。 OpenFOAM と LAMMPS への転送は、支配的なメカニズムがインターフェイスによって変化することを示している。これらの結果は、軽量で自己改善可能な基底層が、一般的なコーディングエージェントを科学ソフトウェアの実運用者に変えることを示唆している。

関連論文リスト

IR-SIM: A Lightweight Skill-Native Simulator for Navigation, Learning, and Benchmarking [59.6657632820611]
IR-SIMは、迅速なシナリオ構築、ベンチマーク、ロボット学習のために設計された、スキルネイティブなナビゲーションシミュレータである。シナリオは、モバイルロボットキネマティクス、幾何学的衝突チェック、LiDARセンシング、可視化、行動モジュールを指定するYAML設定ファイルで完全に定義されている。実験では、複数のタスクにおいてIR-SIMの利便性と汎用性を示す。
論文参考訳（メタデータ） (2026-06-07T16:55:37Z)
AI CFD Scientist: Toward Open-Ended Computational Fluid Dynamics Discovery with Physics-Aware AI Agents [1.7590081165362783]
我々は、計算流体力学のためのオープンソースのAI科学者であるAI CFD Scientistを紹介する。文献に基づくアイデア、検証された実行、視覚に基づく物理検証、ソースコードの修正、図形による記述を単一の検査可能なワークフローで行うのは、これが初めてである。
論文参考訳（メタデータ） (2026-05-07T17:27:23Z)
GENIUS: An Agentic AI Framework for Autonomous Design and Execution of Simulation Protocols [32.505127447635864]
GENIUSは、スマート量子ESPRESSO知識グラフと有限状態エラー回復マシンによって管理される大規模言語モデルの階層構造を融合するAIエージェントワークフローである。 GENIUSは、フリーフォームの人為的なプロンプトを検証済みの入力ファイルに変換し、295の多様なベンチマークの80%の$approxで実行し、76%が自律的に修復され、成功は指数関数的に7%のベースラインに崩壊する。このフレームワークは、プロトコル生成、検証、修復をインテリジェントに自動化して電子構造DFTシミュレーションを民主化し、大規模なスクリーニングとICME設計ループを世界中の学界や業界に開放する。
論文参考訳（メタデータ） (2025-12-06T11:28:35Z)
SOCIA-Nabla: Textual Gradient Meets Multi-Agent Orchestration for Automated Simulator Generation [16.707429579441435]
SOCIA-Nablaは、テキストグラフ内のコードに対するシミュレータ構築の最適化を扱うエンドツーエンドのエージェントフレームワークである。特殊な計算駆動エージェントをグラフノードとして組み込み、ワークフローマネージャが損失駆動ループを実行する:コード合成 ->実行 ->評価 ->コード修復。
論文参考訳（メタデータ） (2025-10-21T12:00:00Z)
LLMs as Scalable, General-Purpose Simulators For Evolving Digital Agent Training [55.72784274656801]
構造化されたUI状態と遷移を生成するスケーラブルなパラダイムを導入し、大規模にトレーニングトラジェクトリを合成する。このパラダイムは、多様なUI状態のためのデジタルワールドシミュレータ、コヒーレント探索のためのガイド付きロールアウトプロセス、軌道ラッパーを統合している。 WebArenaとAndroidWorldの実験では、UI-Simulatorは実際のUIでトレーニングされたオープンソースエージェントと競合するか、あるいは超越している。
論文参考訳（メタデータ） (2025-10-16T17:59:38Z)
G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration [48.948187359727996]
G-Simは、厳密な経験的校正によるシミュレータ構築を自動化するハイブリッドフレームワークである。信頼性のある因果的インフォームドシミュレータを生成し、データ効率を軽減し、堅牢なシステムレベルの介入を可能にする。
論文参考訳（メタデータ） (2025-06-10T22:14:34Z)
Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [57.278726604424556]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文参考訳（メタデータ） (2024-09-12T11:50:06Z)
DriveGAN: Towards a Controllable High-Quality Neural Simulation [147.6822288981004]
DriveGANと呼ばれる新しい高品質のニューラルシミュレータを紹介します。 DriveGANは、異なるコンポーネントを監督なしで切り離すことによって制御性を達成する。実世界の運転データ160時間を含む複数のデータセットでdriveganをトレーニングします。
論文参考訳（メタデータ） (2021-04-30T15:30:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。