論文の概要: SR-Scientist: Scientific Equation Discovery With Agentic AI
- arxiv url: http://arxiv.org/abs/2510.11661v1
- Date: Mon, 13 Oct 2025 17:35:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.484428
- Title: SR-Scientist: Scientific Equation Discovery With Agentic AI
- Title(参考訳): SR-Scientist:エージェントAIによる科学的方程式発見
- Authors: Shijie Xia, Yuhan Sun, Pengfei Liu,
- Abstract要約: SR-Scientistは、単純な方程式の提案者から自律的なAI科学者まで、LLM(Large Language Models)を実装するフレームワークである。
具体的には、コードインタプリタをデータ解析と方程式評価のための一連のツールにラップする。
実証的な結果から、SR-Scientistはデータセットにおいて、絶対的に6%から35%のマージンでベースライン法を上回ります。
- 参考スコア(独自算出の注目度): 27.014966811260212
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, Large Language Models (LLMs) have been applied to scientific equation discovery, leveraging their embedded scientific knowledge for hypothesis generation. However, current methods typically confine LLMs to the role of an equation proposer within search algorithms like genetic programming. In this paper, we present SR-Scientist, a framework that elevates the LLM from a simple equation proposer to an autonomous AI scientist that writes code to analyze data, implements the equation as code, submits it for evaluation, and optimizes the equation based on experimental feedback. Specifically, we wrap the code interpreter into a set of tools for data analysis and equation evaluation. The agent is instructed to optimize the equation by utilizing these tools over a long horizon with minimal human-defined pipelines. Empirical results show that SR-Scientist outperforms baseline methods by an absolute margin of 6% to 35% on datasets covering four science disciplines. Additionally, we demonstrate our method's robustness to noise, the generalization of the discovered equations to out-of-domain data, and their symbolic accuracy. Furthermore, we develop an end-to-end reinforcement learning framework to enhance the agent's capabilities.
- Abstract(参考訳): 近年,Large Language Models (LLMs) が科学的方程式発見に応用され,仮説生成に応用されている。
しかしながら、現在の手法は通常、遺伝的プログラミングのような探索アルゴリズムにおける方程式提案者の役割にLLMを限定する。
本稿では、簡単な方程式の提案者から自律型AI科学者にLLMを昇格させるフレームワークであるSR-Scientistを紹介し、データ解析のためのコードを書き、その式をコードとして実装し、評価のためにそれを提出し、実験的なフィードバックに基づいて方程式を最適化する。
具体的には、コードインタプリタをデータ解析と方程式評価のための一連のツールにラップする。
エージェントは、人間定義のパイプラインが最小限である長い水平線上でこれらのツールを利用することで、方程式を最適化するように指示される。
実証的な結果は、SR-Scientistが4つの科学分野をカバーするデータセットに対して、絶対的に6%から35%の差でベースライン法を上回っていることを示している。
さらに,本手法の雑音に対する堅牢性,発見された方程式の領域外データへの一般化,およびそれらの記号的精度を実証する。
さらに,エージェントの能力を高めるために,エンドツーエンドの強化学習フレームワークを開発する。
関連論文リスト
- TusoAI: Agentic Optimization for Scientific Methods [16.268579802762247]
大規模言語モデル(LLM)は、文学の合成、経験的データによる推論、ドメイン固有コードの生成において強力な能力を示している。
本稿では,評価機能を備えた科学的タスク記述を行うエージェントAIシステムであるTusoAIを紹介する。
TusoAIはドメイン知識を知識ツリー表現に統合し、反復的でドメイン固有の最適化とモデル診断を行う。
論文 参考訳(メタデータ) (2025-09-28T17:30:44Z) - SciML Agents: Write the Solver, Not the Solution [69.5021018644143]
敵の"ミスリーディング"問題の診断データセットと,1,000種類のODEタスクの大規模ベンチマークという,2つの新しいデータセットを紹介した。
オープンおよびクローズドソース LLM モデルについて, (i) 誘導型とガイド型, (ii) オフ・ザ・シェルフ対微調整型という2つの軸に沿って評価した。
予備的な結果は、慎重なプロンプトと微調整により、単純なODE問題を確実に解決できる特殊なLLMエージェントが得られることを示唆している。
論文 参考訳(メタデータ) (2025-09-12T02:53:57Z) - Equation discovery framework EPDE: Towards a better equation discovery [50.79602839359522]
進化的最適化に基づく発見フレームワークであるEPDEアルゴリズムを強化する。
提案手法は基本関数や個人差分といった基本構造ブロックを用いて用語を生成する。
我々は,提案アルゴリズムの耐雑音性および全体的な性能を,最先端の方程式探索フレームワークであるSINDyの結果と比較することによって検証する。
論文 参考訳(メタデータ) (2024-12-28T15:58:44Z) - LLM-SR: Scientific Equation Discovery via Programming with Large Language Models [17.64574496035502]
現在の方程式発見法は、典型的には記号回帰と呼ばれ、主にデータのみから方程式を抽出することに焦点を当てている。
LLM-SRは,大規模言語モデルの科学的知識とロバストなコード生成能力を活用する新しいアプローチである。
また, LLM-SRは, 最先端の記号的回帰ベースラインを著しく上回る物理精度の方程式を発見した。
論文 参考訳(メタデータ) (2024-04-29T03:30:06Z) - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation [83.30006900263744]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。
LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。
我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文 参考訳(メタデータ) (2024-03-04T22:47:58Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - SciMED: A Computational Framework For Physics-Informed Symbolic
Regression with Scientist-In-The-Loop [0.0]
我々はSciMED(Scientist-Machine Equation Detector)と呼ばれる新しいオープンソースの計算フレームワークを提案する。
SciMEDは科学分野の知恵をサイエント・イン・ザ・ループアプローチと最先端の象徴的回帰手法に統合する。
SciMEDはノイズデータから正しい物理的意味のある記号表現を発見するのに十分頑健であることを示す。
論文 参考訳(メタデータ) (2022-09-13T18:31:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。