論文の概要: Current Challenges of Symbolic Regression: Optimization, Selection, Model Simplification, and Benchmarking
- arxiv url: http://arxiv.org/abs/2512.01682v1
- Date: Mon, 01 Dec 2025 13:48:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.878313
- Title: Current Challenges of Symbolic Regression: Optimization, Selection, Model Simplification, and Benchmarking
- Title(参考訳): シンボリック回帰の最近の課題:最適化、選択、モデルの単純化、ベンチマーク
- Authors: Guilherme Seidyo Imai Aldeia,
- Abstract要約: 記号回帰(SR)は、変数間の関係を記述する数学的表現を見つけることを目的としている。
現在の手法はSRの景観を理解するために常に再評価されなければならない。
この論文は、博士課程全体で行われた一連の研究を通じて、これらの課題に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symbolic Regression (SR) is a regression method that aims to discover mathematical expressions that describe the relationship between variables, and it is often implemented through Genetic Programming, a metaphor for the process of biological evolution. Its appeal lies in combining predictive accuracy with interpretable models, but its promise is limited by several long-standing challenges: parameters are difficult to optimize, the selection of solutions can affect the search, and models often grow unnecessarily complex. In addition, current methods must be constantly re-evaluated to understand the SR landscape. This thesis addresses these challenges through a sequence of studies conducted throughout the doctorate, each focusing on an important aspect of the SR search process. First, I investigate parameter optimization, obtaining insights into its role in improving predictive accuracy, albeit with trade-offs in runtime and expression size. Next, I study parent selection, exploring $ε$-lexicase to select parents more likely to generate good performing offspring. The focus then turns to simplification, where I introduce a novel method based on memoization and locality-sensitive hashing that reduces redundancy and yields simpler, more accurate models. All of these contributions are implemented into a multi-objective evolutionary SR library, which achieves Pareto-optimal performance in terms of accuracy and simplicity on benchmarks of real-world and synthetic problems, outperforming several contemporary SR approaches. The thesis concludes by proposing changes to a famous large-scale symbolic regression benchmark suite, then running the experiments to assess the symbolic regression landscape, demonstrating that a SR method with the contributions presented in this thesis achieves Pareto-optimal performance.
- Abstract(参考訳): シンボリック回帰(英: Symbolic Regression、SR)は、変数間の関係を記述する数学的表現の発見を目的とした回帰法であり、しばしば生物学的進化の過程の比喩である遺伝的プログラミングによって実装される。
その魅力は、予測精度と解釈可能なモデルを組み合わせることであるが、その約束は、パラメータの最適化が困難で、解の選択が探索に影響を与えることがあり、モデルは必要以上に複雑に成長する。
さらに、現在の手法はSRの景観を理解するために常に再評価されなければならない。
この論文は、これらの課題を博士課程全体を通して一連の研究を通じて解決し、それぞれがSR探索プロセスの重要な側面に焦点を当てている。
まず,パラメータ最適化について検討し,予測精度の向上に果たす役割について考察する。
次に、私は親の選択を研究し、親を選別するために$ε$-lexicaseを探索します。
そこで、メモ化と局所性に敏感なハッシュに基づく新しい手法を導入し、冗長性を低減し、よりシンプルで正確なモデルを生み出す。
これらのコントリビューションはすべて多目的進化SRライブラリに実装され、現実問題や合成問題のベンチマークにおける精度と単純さの観点からパレート最適性能を達成し、現代のSRアプローチよりも優れている。
この論文は、有名な大規模な記号的回帰ベンチマークスイートの変更を提案し、その実験を実行して、象徴的回帰の景観を評価することで、この論文で提示された貢献を伴うSR法がパレート最適性能を達成することを実証することで、結論付けている。
関連論文リスト
- Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - Taming Polysemanticity in LLMs: Provable Feature Recovery via Sparse Autoencoders [50.52694757593443]
既存のSAEトレーニングアルゴリズムは厳密な数学的保証を欠いていることが多く、実用的な制限に悩まされている。
まず,特徴の特定可能性という新たな概念を含む特徴回復問題の統計的枠組みを提案する。
本稿では、ニューラルネットワークのバイアスパラメータを適応的に調整し、適切なアクティベーション間隔を確保する手法である「バイアス適応」に基づく新たなSAEトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-16T20:58:05Z) - Call for Action: towards the next generation of symbolic regression benchmark [2.7253033812941387]
記号回帰は解釈可能な数学的表現を発見するための強力なテクニックである。
SR手法のベンチマークはアルゴリズム、データセット、評価基準の多様性のために依然として難しい。
論文 参考訳(メタデータ) (2025-05-06T21:02:20Z) - Chain-of-Retrieval Augmented Generation [91.02950964802454]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - Ab Initio Nonparametric Variable Selection for Scalable Symbolic Regression with Large $p$ [2.222138965069487]
シンボリック回帰(SR)は、データの非線形関係を特徴付けるシンボリック表現を発見するための強力な手法である。
既存のSR法は、多くの入力変数を持つデータセットにスケールしないが、現代の科学的応用では一般的である。
本稿では,Ab初期非パラメトリック変数選択とSRを組み合わせたPAN+SRを提案する。
論文 参考訳(メタデータ) (2024-10-17T15:41:06Z) - Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z) - ParFam -- (Neural Guided) Symbolic Regression Based on Continuous Global Optimization [14.146976111782466]
我々は、離散的記号回帰問題を連続的な問題に変換するために、新しいアプローチであるParFamを提案する。
グローバルな手法と組み合わせることで、SRの問題に対処する非常に効果的な手法がもたらされる。
また、ParFamをガイドするために、事前訓練されたトランスフォーマーネットワークDL-ParFamを組み込んだ拡張も提案する。
論文 参考訳(メタデータ) (2023-10-09T09:01:25Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Transformer-based Planning for Symbolic Regression [18.90700817248397]
シンボリック・レグレッションのためのトランスフォーマーに基づく計画戦略であるTPSRを提案する。
従来の復号法とは異なり、TPSRは精度や複雑さなど、微分不可能なフィードバックの統合を可能にする。
我々の手法は最先端の手法より優れており、モデルの適合・複雑性トレードオフ、象徴的能力、騒音に対する堅牢性を高めている。
論文 参考訳(メタデータ) (2023-03-13T03:29:58Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - GSR: A Generalized Symbolic Regression Approach [13.606672419862047]
本論文では, 一般化記号回帰について述べる。
GSR法は、よく知られたシンボリック回帰ベンチマーク問題セットにおいて、最先端のいくつかの手法よりも優れていることを示す。
既存のベンチマークと比較して、より困難な新しいSRベンチマークセットであるSymSetを導入することで、GSRの強みを強調します。
論文 参考訳(メタデータ) (2022-05-31T07:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。