論文の概要: Think like a Scientist: Physics-guided LLM Agent for Equation Discovery
- arxiv url: http://arxiv.org/abs/2602.12259v1
- Date: Thu, 12 Feb 2026 18:49:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.987773
- Title: Think like a Scientist: Physics-guided LLM Agent for Equation Discovery
- Title(参考訳): 物理誘導型LLMエージェント「科学者」
- Authors: Jianke Yang, Ohm Venkatachalam, Mohammad Kianezhad, Sharvaree Vadgama, Rose Yu,
- Abstract要約: 大型言語モデル (LLM) は記号方程式発見のための有望なツールとして登場してきた。
我々は、この科学的推論プロセスに明示的に従うエージェントフレームワークであるKeplerAgentを紹介する。
KeplerAgent は LLM や従来のベースラインよりもかなり高い記号精度とノイズの多いデータに対するロバスト性を実現している。
- 参考スコア(独自算出の注目度): 22.586956876641406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Explaining observed phenomena through symbolic, interpretable formulas is a fundamental goal of science. Recently, large language models (LLMs) have emerged as promising tools for symbolic equation discovery, owing to their broad domain knowledge and strong reasoning capabilities. However, most existing LLM-based systems try to guess equations directly from data, without modeling the multi-step reasoning process that scientists often follow: first inferring physical properties such as symmetries, then using these as priors to restrict the space of candidate equations. We introduce KeplerAgent, an agentic framework that explicitly follows this scientific reasoning process. The agent coordinates physics-based tools to extract intermediate structure and uses these results to configure symbolic regression engines such as PySINDy and PySR, including their function libraries and structural constraints. Across a suite of physical equation benchmarks, KeplerAgent achieves substantially higher symbolic accuracy and greater robustness to noisy data than both LLM and traditional baselines.
- Abstract(参考訳): 象徴的で解釈可能な公式を通して観測された現象を説明することは、科学の基本的な目標である。
近年,大きな言語モデル (LLM) が,その広範なドメイン知識と強力な推論能力から,記号方程式発見の有望なツールとして出現している。
しかし、既存のLLMベースのシステムの多くは、科学者がしばしば従う多段階の推論過程をモデル化することなく、データから直接方程式を推測しようとする。
我々は、この科学的推論プロセスに明示的に従うエージェントフレームワークであるKeplerAgentを紹介する。
このエージェントは、物理ベースのツールで中間構造を抽出し、これらの結果を用いて、関数ライブラリや構造制約を含むPySINDyやPySRなどのシンボリック回帰エンジンを構成する。
物理方程式ベンチマークのスイート全体で、KeplerAgent は LLM や従来のベースラインよりもかなり高い記号的精度と、ノイズの多いデータに対するロバスト性を達成している。
関連論文リスト
- An Agentic Framework for Autonomous Materials Computation [70.24472585135929]
大規模言語モデル(LLM)は、科学的発見を加速するための強力なツールとして登場した。
近年の進歩はLLMをエージェントフレームワークに統合し、複雑な科学実験のための検索、推論、ツールの使用を可能にしている。
本稿では,第一原理計算の信頼性向上を目的としたドメイン特化エージェントを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:03:57Z) - SR-Scientist: Scientific Equation Discovery With Agentic AI [27.014966811260212]
SR-Scientistは、単純な方程式の提案者から自律的なAI科学者まで、LLM(Large Language Models)を実装するフレームワークである。
具体的には、コードインタプリタをデータ解析と方程式評価のための一連のツールにラップする。
実証的な結果から、SR-Scientistはデータセットにおいて、絶対的に6%から35%のマージンでベースライン法を上回ります。
論文 参考訳(メタデータ) (2025-10-13T17:35:23Z) - Mimicking the Physicist's Eye:A VLM-centric Approach for Physics Formula Discovery [98.58830663687911]
VIPERR-aq1は、方程式推論のための視覚誘導を行うマルチモーダルモデルである。
視覚知覚、軌跡データ、象徴的推論を統合し、科学的発見過程をエミュレートする。
常に最先端のVLMベースラインを精度と解釈性で上回る。
論文 参考訳(メタデータ) (2025-08-24T14:34:21Z) - DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience [14.093206703519103]
DrSRは、データ駆動の洞察と反射学習を組み合わせて、堅牢性と発見能力の両方を強化するフレームワークである。
物理学、化学、生物学、材料科学における学際的なデータセットにわたる実験は、DrSRが有効な方程式率を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-06-04T04:52:34Z) - LLM-SR: Scientific Equation Discovery via Programming with Large Language Models [17.64574496035502]
現在の方程式発見法は、典型的には記号回帰と呼ばれ、主にデータのみから方程式を抽出することに焦点を当てている。
LLM-SRは,大規模言語モデルの科学的知識とロバストなコード生成能力を活用する新しいアプローチである。
また, LLM-SRは, 最先端の記号的回帰ベースラインを著しく上回る物理精度の方程式を発見した。
論文 参考訳(メタデータ) (2024-04-29T03:30:06Z) - SciInstruct: a Self-Reflective Instruction Annotated Dataset for Training Scientific Language Models [57.96527452844273]
我々はSciInstructを紹介した。SciInstructは、大学レベルの科学的推論が可能な科学言語モデルを訓練するための科学指導スイートである。
我々は、物理学、化学、数学、公式な証明を含む多種多様な高品質なデータセットをキュレートした。
SciInstructの有効性を検証するため、SciInstruct、すなわちChatGLM3(6Bと32B)、Llama3-8B-Instruct、Mistral-7B: MetaMathを用いて言語モデルを微調整した。
論文 参考訳(メタデータ) (2024-01-15T20:22:21Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。