論文の概要: Programmatic Context Augmentation for LLM-based Symbolic Regression
- arxiv url: http://arxiv.org/abs/2605.03101v1
- Date: Mon, 04 May 2026 19:34:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.622595
- Title: Programmatic Context Augmentation for LLM-based Symbolic Regression
- Title(参考訳): LLMに基づくシンボリック回帰のためのプログラム文脈拡張
- Authors: Hao Liu, Xiao-Wen Yang, Atharva Sehgal, Yixin Wang, Lan-Zhe Guo, Yu-Feng Li, Yisong Yue,
- Abstract要約: 大規模言語モデル(LLM)に基づく進化的探索手法が記号回帰に導入されている。
本稿では,プログラム的文脈拡張を取り入れたLLMに基づく進化的検索フレームワークを提案する。
本手法では,データ解析と情報信号抽出を積極的に行うことができる。
- 参考スコア(独自算出の注目度): 65.01826333382738
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Symbolic regression (SR), the task of discovering mathematical expressions that best describe a given dataset, remains a fundamental challenge in scientific discovery. Traditional approaches, primarily based on genetic algorithms and related evolutionary methods, have proven useful but suffer from scalability and expressivity limitations. Recently, large language model (LLM)-based evolutionary search methods have been introduced into SR and show promise. However, existing LLM-based approaches typically rely on scalar evaluation metrics, such as mean squared error, as the sole source of feedback during the search process, thereby overlooking the rich information embedded in the dataset. To address this limitation, we propose a novel LLM-based evolutionary search framework that incorporates programmatic context augmentation. By enabling code-based interactions with the dataset, our method can actively perform data analysis and extract informative signals, beyond aggregated evaluation scores. We evaluate our framework on advanced benchmarks, such as LLM-SRBench, and demonstrate superior efficiency and accuracy compared to strong baselines.
- Abstract(参考訳): シンボリック回帰(SR)は、与えられたデータセットを最もよく記述する数学的表現を発見するタスクであり、科学的な発見における根本的な課題である。
遺伝的アルゴリズムと関連する進化的手法に基づく伝統的なアプローチは有用であるが、スケーラビリティと表現力の限界に悩まされている。
近年,大言語モデル (LLM) に基づく進化的探索手法がSRに導入され,将来性を示す。
しかし、既存のLLMベースのアプローチは、通常、平均二乗誤差のようなスカラー評価指標を検索プロセス中のフィードバックの唯一の源として頼りにしており、それによってデータセットに埋め込まれた豊富な情報を見渡すことができる。
この制限に対処するために,プログラム的文脈拡張を組み込んだLLMベースの進化的検索フレームワークを提案する。
提案手法は,データセットとのコードベースインタラクションを可能とすることにより,データ解析と情報信号の抽出を,集約された評価スコアを超えて積極的に行うことができる。
LLM-SRBenchのような高度なベンチマークでフレームワークを評価し,強いベースラインと比較して高い効率と精度を示す。
関連論文リスト
- Pushing LLMs to Their Logical Reasoning Bound: The Role of Data Reasoning Intensity [59.27594125465172]
データ推論強度 (Data Reasoning Intensity, DRI) は, サンプルの潜在論理的推論複雑性を定量化する新しい指標である。
次に、学習データの論理的推論強度を体系的に強化する再認識最適化戦略を導入する。
論文 参考訳(メタデータ) (2025-09-29T14:20:04Z) - SemSR: Semantics aware robust Session-based Recommendations [11.582625739065785]
セッションベースのレコメンデーション(SR)モデルは、現在のセッション中の行動に基づいて、匿名ユーザに対してアイテムを推薦することを目的としている。
様々なSRモデルは、セッション意図の識別と解釈可能性を妨げる項目のタイトルや説明からの意味情報を活用できない。
最近の研究は、セッションベースのレコメンデーションを強化するための有望なアプローチとして、Large Language Models (LLM)を調査している。
論文 参考訳(メタデータ) (2025-08-28T09:25:54Z) - Large Language Models as Universal Predictors? An Empirical Study on Small Tabular Datasets [0.0]
大規模言語モデル(LLM)は、下流タスクを明示的に微調整することなく、構造化された入力に対して予測タスクを実行することができる。
分類,回帰,クラスタリングタスクのための小規模構造化データセット上でのLCMの実証関数近似能力について検討した。
以上の結果から,LLMは構造化データの汎用的予測エンジンとして機能する可能性が示唆された。
論文 参考訳(メタデータ) (2025-08-24T15:00:51Z) - DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience [14.093206703519103]
DrSRは、データ駆動の洞察と反射学習を組み合わせて、堅牢性と発見能力の両方を強化するフレームワークである。
物理学、化学、生物学、材料科学における学際的なデータセットにわたる実験は、DrSRが有効な方程式率を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-06-04T04:52:34Z) - DARG: Dynamic Evaluation of Large Language Models via Adaptive Reasoning Graph [70.79413606968814]
本稿では,適応推論グラフ展開(DARG)によるLCMの動的評価を導入し,複雑性と多様性を制御した現在のベンチマークを動的に拡張する。
具体的には、まず現在のベンチマークでデータポイントの推論グラフを抽出し、それから推論グラフを摂動させて新しいテストデータを生成する。
このような新しく生成されたテストサンプルは、元のベンチマークと同様の言語的多様性を維持しながら、複雑さのレベルが異なる可能性がある。
論文 参考訳(メタデータ) (2024-06-25T04:27:53Z) - In-Context Symbolic Regression: Leveraging Large Language Models for Function Discovery [5.2387832710686695]
本稿では,記号回帰のタスクにLarge Language Models(LLM)を利用する,最初の包括的フレームワークを紹介する。
In-Context Symbolic Regression (ICSR) は、外部LLMで関数形式を反復的に洗練し、その係数を外部LLMで決定するSR手法である。
以上の結果から,LLMは与えられたデータに適合するシンボリック方程式の発見に成功し,最高のSRベースラインの総合性能を4つのベンチマークで評価した。
論文 参考訳(メタデータ) (2024-04-29T20:19:25Z) - On Learning to Summarize with Large Language Models as References [101.79795027550959]
大型言語モデル (LLM) は、一般的な要約データセットにおける元の参照要約よりも人間のアノテーションに好まれる。
より小さなテキスト要約モデルに対するLLM-as-reference学習設定について検討し,その性能が大幅に向上するかどうかを検討する。
論文 参考訳(メタデータ) (2023-05-23T16:56:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。