論文の概要: Iterated Agent for Symbolic Regression
- arxiv url: http://arxiv.org/abs/2510.08317v1
- Date: Thu, 09 Oct 2025 15:02:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:15.153937
- Title: Iterated Agent for Symbolic Regression
- Title(参考訳): シンボリック回帰のための反復剤
- Authors: Zhuo-Yang Song, Zeyu Cai, Shutao Zhang, Jiashen Wei, Jichen Pan, Shi Qiu, Qing-Hong Cao, Tie-Jiun Hou, Xiaohui Liu, Ming-xing Luo, Hua Xing Zhu,
- Abstract要約: 本稿では,Large Language Models (LLM) を進化的探索のセマンティック演算子として利用するフレームワークであるIdeanSearchFitterを紹介する。
自然言語の合理性によって導かれる候補表現を生成することにより,本手法は,正確なだけでなく,概念的に一貫性があり,解釈可能なモデルへの発見をバイアスする。
- 参考スコア(独自算出の注目度): 5.401750491164173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Symbolic regression (SR), the automated discovery of mathematical expressions from data, is a cornerstone of scientific inquiry. However, it is often hindered by the combinatorial explosion of the search space and a tendency to overfit. Popular methods, rooted in genetic programming, explore this space syntactically, often yielding overly complex, uninterpretable models. This paper introduces IdeaSearchFitter, a framework that employs Large Language Models (LLMs) as semantic operators within an evolutionary search. By generating candidate expressions guided by natural-language rationales, our method biases discovery towards models that are not only accurate but also conceptually coherent and interpretable. We demonstrate IdeaSearchFitter's efficacy across diverse challenges: it achieves competitive, noise-robust performance on the Feynman Symbolic Regression Database (FSReD), outperforming several strong baselines; discovers mechanistically aligned models with good accuracy-complexity trade-offs on real-world data; and derives compact, physically-motivated parametrizations for Parton Distribution Functions in a frontier high-energy physics application. IdeaSearchFitter is a specialized module within our broader iterated agent framework, IdeaSearch, which is publicly available at https://www.ideasearch.cn/.
- Abstract(参考訳): 記号回帰(SR)は、データから数学的表現の自動発見であり、科学的調査の基盤となっている。
しかし、しばしば探索空間の組合せ爆発と過度に適合する傾向によって妨げられる。
遺伝的プログラミングに根ざした一般的な手法は、この空間を構文的に探求し、しばしば複雑で解釈不能なモデルを生み出す。
本稿では,Large Language Models (LLM) を進化的探索のセマンティック演算子として利用するフレームワークであるIdeanSearchFitterを紹介する。
自然言語の合理性によって導かれる候補表現を生成することにより、本手法は、正確であるだけでなく、概念的に一貫性があり、解釈可能なモデルに対する発見をバイアスする。
本稿では,Feynman Symbolic Regression Database (FSReD) 上での競合・ノイズ・ロバストな性能を実現し,いくつかの強力なベースラインを上回り,実世界のデータに高い精度・複雑度トレードオフを持つメカニカル整列モデルを発見し,フロンティア高エネルギー物理アプリケーションにおける粒子分布関数のコンパクトで物理的に動機付けられたパラメトリゼーションを導出する。
IdeaSearchFitterは、我々のより広範な反復エージェントフレームワークであるIdeanSearchの特殊なモジュールで、https://www.ideasearch.cn/.comで公開されている。
関連論文リスト
- Discovering physical laws with parallel symbolic enumeration [67.36739393470869]
並列記号列挙法(PSE)を導入し,限られたデータから汎用数学的表現を効率的に抽出する。
実験の結果,PSEは最先端のベースラインアルゴリズムと比較して精度が高く,計算速度も速いことがわかった。
PSEは、記号的、解釈可能なモデルの正確で効率的なデータ駆動による発見の進歩を表している。
論文 参考訳(メタデータ) (2024-07-05T10:41:15Z) - On Least Square Estimation in Softmax Gating Mixture of Experts [78.3687645289918]
決定論的MoEモデルに基づく最小二乗推定器(LSE)の性能について検討する。
我々は,多種多様な専門家関数の収束挙動を特徴付けるために,強い識別可能性という条件を確立する。
本研究は,専門家の選択に重要な意味を持つ。
論文 参考訳(メタデータ) (2024-02-05T12:31:18Z) - Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。