論文の概要: FunctionEvolve: Structure-Guided Symbolic Regression with LLMs
- arxiv url: http://arxiv.org/abs/2606.07704v1
- Date: Fri, 05 Jun 2026 09:18:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.295607
- Title: FunctionEvolve: Structure-Guided Symbolic Regression with LLMs
- Title(参考訳): FunctionEvolve: LLMを用いた構造誘導型シンボリック回帰
- Authors: Zeyu Xia, Jun Zhu, Dong Yan,
- Abstract要約: FunctionEvolveは、式木を使って検索全体を整理する進化的フレームワークである。
107個の正確な形状を復元し、同じバックボーンのベースラインより82.9%のSA@50、4.5倍のSA@1、3.6倍のSA@1に達する。
- 参考スコア(独自算出の注目度): 26.85183376972782
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Symbolic regression aims to uncover explicit scientific laws from data. Recent methods use LLMs to guide mutation from background text, which is more directed than random genetic programming. However, exact symbolic recovery requires both semantic guidance and explicit structure, so that domain-informed search are carried out through valid symbolic representation. Current LLM-driven systems remain structure-blind: they select among opaque candidates, lack explicit mechanisms for local mutation, and rely on brittle coefficient fitting that can undervalue correct skeletons. We propose FunctionEvolve, an evolutionary framework using expression trees to organize the whole search: structural summaries promote diverse parent selection, local tree edits preserve useful subexpressions, and structure-aware fitting decomposes, constrains, and simplifies coefficients for more reliable scoring. It uses only elementary function families, without additional domain-specific rules limiting generalization. On the 129-task synthetic subset of LLM-SRBench, FunctionEvolve with \emph{Claude Opus 4.6} recovers 107 exact forms, reaching 82.9% SA@50, 4.5x above same-backbone baselines, and 55.8% SA@1, 3.6x above the strongest previously published top-1 result. Ablations show that structure-visible search is central to reliable recovery, with LLM-guided refinements and structure-aware coefficient optimization serving as essential proposal and scoring mechanisms. We also audit the benchmark and show that collinearity in its materials-science subset creates identifiability issues.
- Abstract(参考訳): 象徴的回帰は、データから明確な科学的法則を明らかにすることを目的としている。
最近の手法では、ランダムな遺伝的プログラミングよりも指向性が高い背景テキストから変異を誘導するためにLSMを使用する。
しかし、正確なシンボリックリカバリには意味指導と明示的構造の両方が必要であるため、ドメインインフォームド検索は有効なシンボリック表現によって実行される。
現在のLSM駆動システムは、不透明な候補の中から選択され、局所的な突然変異の明確なメカニズムが欠如し、正しい骨格を過小評価できる脆い係数のフィッティングに依存している。
構造的要約は多様な親選択を促進し、局所木編集は有用な部分表現を保存し、構造的適応は分解、制約、より信頼性の高いスコアリングのための係数を単純化する。
これは、一般化を制限する追加のドメイン固有の規則なしで、基本的な関数ファミリのみを使用する。
LLM-SRBenchの129タクの合成部分集合では、FunctionEvolve with \emph{Claude Opus 4.6} は107個の正確な形を復元し、同じバックボーンのベースラインより82.9% SA@50, 4.5倍、最強の上位-1 結果より55.8% SA@1, 3.6倍高い。
アブレーションは、構造視検索が信頼性の高いリカバリの中心であり、LLM誘導の洗練と構造認識係数の最適化が本質的な提案とスコアリング機構として機能していることを示している。
また、ベンチマークを監査し、その物質科学サブセットのコリニアリティが識別可能性の問題を引き起こすことを示す。
関連論文リスト
- Deliberate Evolution: Agentic Reasoning for Sample-Efficient Symbolic Regression with LLMs [52.89778838903305]
Deliberate Evolution (DE) は、検索制御からシンボル生成を分離するエージェントフレームワークである。
LLM-SRBenchの実験では、DEMは様々な科学領域でLLMベースのSRベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-06-03T02:22:16Z) - Influence-Guided Symbolic Regression: Scientific Discovery via LLM-Driven Equation Search with Granular Feedback [56.69850045068714]
逐次的2段階プロセスとして方程式発見をフレーム化する方法である textitInfluence-Guided Regression (IGSR) を導入する。
LLM-SRBench, 薬理学的PKPDモデル, 疫学シミュレーション, 実世界のゲノムデータなど, IGSRの有効性を示す。
論文 参考訳(メタデータ) (2026-05-27T23:48:01Z) - From Residuals to Reasons: LLM-Guided Mechanism Inference from Tabular Data [10.795877029195845]
科学的応用のための機械学習における永続的な課題は、予測と理解を共同で達成することである。
マルチエージェント残差文脈学習(MARICL)を導入する。
MARICLは、すべてのデータセットのベースモデルに対して一貫して改善されている。
論文 参考訳(メタデータ) (2026-05-21T15:34:08Z) - Geometric Factual Recall in Transformers [57.48371649045765]
一般的な見解では、内部の重み行列は埋め込みのペアに対する連想記憶として捉えられ、事実の数と線形にスケールする記憶数を必要とする。
我々は、学習した埋め込みが直接構造を符号化する、別のエンフェロメトリックな形態の記憶の理論的、実証的な説明を開発する。
単層変圧器が被写体から共有属性集合へのランダムベクトルを記憶しなければならない制御環境では、対数埋め込み次元が十分であることを示す。
これらの結果をマルチホップ設定に拡張し、証明可能なチェーン・オブ・シークレットによる構築を提供する。
論文 参考訳(メタデータ) (2026-05-12T17:22:22Z) - STaR-DRO: Stateful Tsallis Reweighting for Group-Robust Structured Prediction [0.20165644958637055]
制御可能な推論と堅牢な微調整のための2部フレームワークを提案する。
まず、フォーマットのドリフト、ラベルの曖昧さ、エビデンス幻覚、メタデータ条件の混乱に対処するためのタスクに依存しないプロンプト戦略を導入する。
第2に,グループ不均一性のステートフルなロバスト最適化手法STaR-DROを導入する。
論文 参考訳(メタデータ) (2026-04-09T21:58:42Z) - HCRE: LLM-based Hierarchical Classification for Cross-Document Relation Extraction with a Prediction-then-Verification Strategy [54.91468501159335]
文書間関係抽出 (RE) は, 異なる文書に存在する頭部尾部エンティティ間の関係を識別することを目的としている。
本稿では,各レベルでの多視点検証により信頼性を向上させる推論戦略を提案する。
論文 参考訳(メタデータ) (2026-04-09T07:55:27Z) - Improving LLM Reasoning with Homophily-aware Structural and Semantic Text-Attributed Graph Compression [55.51959317490934]
大規模言語モデル(LLM)は、テキスト分散グラフ(TAG)理解において有望な能力を示している。
グラフは本来、構造情報や意味情報を豊富に含むものであり、それらの有効利用はLLMの推論性能の潜在的な利益を解放する可能性があると論じる。
グラフホモフィリーの活用を目的としたフレームワーク LLMs (HS2C) のホモフィリー対応構造とセマンティック圧縮を提案する。
論文 参考訳(メタデータ) (2026-01-13T03:35:18Z) - Automatic Posology Structuration : What role for LLMs? [1.0445560141983634]
自由文ポソジを構造化形式に変換するために,Large Language Models (LLM) の利用について検討する。
提案手法は,性能向上に寄与するが,ベースラインの精度は微調整LLMのみである。
そこで我々は,NERL から LLM へ低信頼度ケースをルーティングし,信頼度スコアに基づいて出力を選択するハイブリッドパイプラインを提案する。
論文 参考訳(メタデータ) (2025-06-24T11:25:21Z) - Sneaking Syntax into Transformer Language Models with Tree Regularization [33.74552367356904]
構文的帰納バイアスの導入は、トランスフォーマー言語モデルにおけるより堅牢でデータ効率のよい学習を解放する可能性がある。
ここでは,銀パースからの括弧決定を微分可能性制約の集合に変換する補助的損失関数であるTreeRegを紹介する。
TreeRegは標準のLM目標とシームレスに統合され、アーキテクチャの変更は不要である。
論文 参考訳(メタデータ) (2024-11-28T03:27:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。