論文の概要: ERBench: A Benchmark and Testsuite for Equation Discovery Algorithms
- arxiv url: http://arxiv.org/abs/2606.09276v1
- Date: Mon, 08 Jun 2026 09:43:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.906382
- Title: ERBench: A Benchmark and Testsuite for Equation Discovery Algorithms
- Title(参考訳): ERBench: 方程式探索アルゴリズムのベンチマークとテストスーツ
- Authors: Paul Kahlmeyer, Henrik Voigt, Michael Habeck, Joachim Giesen,
- Abstract要約: 方程式発見は、データから数学的方程式の形で科学モデルの発見を自動化することを目的としている。
方程式発見のためのシンボリック回帰の性能は、テストデータの予測精度と既知の基底式の回復の2つの次元に沿って測定される。
Equation Recovery Benchmark (ERBench) は、方程式発見のタスクを対象とするアルゴリズムを厳格に評価する新しい評価フレームワークである。
- 参考スコア(独自算出の注目度): 15.861690390576433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Equation discovery aims to automate the discovery of scientific models in the form of mathematical equations from data. Technically, equation discovery is implemented by symbolic regression algorithms. Performance of symbolic regression for equation discovery is measured along two dimensions: Prediction accuracy on test data, and recovery of known groundtruth formulas. For standard regression, accuracy is typically measured on in-domain test data, for instance, by splitting a data set randomly into training and test data. While this makes sense for in-domain interpolation, which is the common goal in ordinary regression, it can be a misleading proxy for true model discovery and generalization. The obvious alternative is to measure out-of-domain accuracy. However, obtaining challenging out-of-domain test data is a non-trivial problem. Therefore, we focus on equation recovery for evaluating symbolic regression algorithms for equation discovery. The rationale is that symbolic regression algorithms that perform well in recovering known groundtruth formulas are good candidates to perform well in unknown equation discovery. Existing benchmarks for symbolic regression include equation recovery tasks, however, with only a small number of groundtruth formulas that are publicly known. Moreover, these benchmarks place less emphasis on evaluating the robustness of algorithms in terms of their behavior under changing dimensionality, sampling size, sampling distribution and sampling domain. This, however, is of central importance to practitioners wanting to discover equations for modeling natural phenomena, since data is almost certainly noisy and comes from diverse domains, distributions, and sample sizes. To fill this gap, we introduce the Equation Recovery Benchmark (ERBench), a new evaluation framework designed to rigorously assess algorithms explicitly targeting the task of equation discovery.
- Abstract(参考訳): 方程式発見は、データから数学的方程式の形で科学モデルの発見を自動化することを目的としている。
技術的には、方程式発見はシンボリック回帰アルゴリズムによって実装される。
方程式発見のためのシンボリック回帰の性能は、テストデータの予測精度と既知の基底式の回復の2つの次元に沿って測定される。
標準的な回帰では、例えば、データセットをランダムにトレーニングデータとテストデータに分割することで、ドメイン内のテストデータに基づいて精度が測定される。
これは、通常の回帰における共通のゴールであるドメイン内補間には意味があるが、真のモデル発見と一般化のための誤解を招くプロキシである。
明らかな代替手段は、ドメイン外の精度を測定することである。
しかし、ドメイン外のテストデータを取得することは簡単な問題ではない。
そこで我々は,方程式発見のためのシンボリック回帰アルゴリズムを評価するために,方程式回復に着目した。
理論的には、未知の方程式の発見において、既知の基底式を回復する上でよく機能するシンボリック回帰アルゴリズムが良い候補である。
しかし、既存のシンボリック回帰のベンチマークには、方程式の回復タスクが含まれており、一般に知られている基底式はごくわずかである。
さらに、これらのベンチマークは、次元、サンプリングサイズ、サンプリング分布、サンプリング領域の変化の下でのアルゴリズムの振る舞いの観点から、アルゴリズムの堅牢性を評価することに重点を置いている。
しかし、これは自然現象をモデル化するための方程式を発見したい実践者にとって重要であり、データはほぼ確実にノイズがあり、多様な領域、分布、サンプルサイズから来ている。
このギャップを埋めるために、方程式探索タスクを対象とするアルゴリズムを厳格に評価する新しい評価フレームワークである方程式回復ベンチマーク(ERBench)を導入する。
関連論文リスト
- Data-Efficient Symbolic Regression via Foundation Model Distillation [34.0701397977874]
EQUATEは、蒸留を通じて低データ状態における記号方程式の発見に基礎モデルを適用するフレームワークである。
精度と堅牢性の両方において、最先端のベースラインを一貫して上回る。
これらの結果は、データ効率のシンボリックレグレッションのための実用的で一般化可能なソリューションとして、EQUATEを強調している。
論文 参考訳(メタデータ) (2025-08-27T00:18:48Z) - Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - ReLU Regression with Massart Noise [52.10842036932169]
本稿では、ReLU回帰の基本的問題として、Rectified Linear Units(ReLU)をデータに適合させることを目標としている。
我々は自然およびよく研究された半ランダムノイズモデルであるMassartノイズモデルにおけるReLU回帰に着目した。
このモデルにおいて,パラメータの正確な回復を実現する効率的なアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-09-10T02:13:22Z) - Contemporary Symbolic Regression Methods and their Relative Performance [5.285811942108162]
本研究では,252種類の回帰問題に対して,14のシンボル回帰法と7つの機械学習法を評価する。
実世界のデータセットでは、各手法が低いエラーと低い複雑さでモデルを学習する能力をベンチマークする。
合成問題に対して,様々なレベルのノイズが存在する場合に,各手法の正確な解を求める能力を評価する。
論文 参考訳(メタデータ) (2021-07-29T22:12:59Z) - Neural Symbolic Regression that Scales [58.45115548924735]
本稿では,大規模事前学習を利用した最初の記号回帰手法を提案する。
我々は,非有界な方程式の集合を手続き的に生成し,同時にインプット・アウトプット・ペアの集合からシンボル方程式を予測するためにトランスフォーマーを事前訓練する。
論文 参考訳(メタデータ) (2021-06-11T14:35:22Z) - Fast OSCAR and OWL Regression via Safe Screening Rules [97.28167655721766]
順序付き$L_1$ (OWL)正規化回帰は、高次元スパース学習のための新しい回帰分析である。
近勾配法はOWL回帰を解くための標準手法として用いられる。
未知の順序構造を持つ原始解の順序を探索することにより、OWL回帰の最初の安全なスクリーニングルールを提案する。
論文 参考訳(メタデータ) (2020-06-29T23:35:53Z) - AI Feynman 2.0: Pareto-optimal symbolic regression exploiting graph
modularity [8.594811303203581]
本稿では,Pareto-Optimal式にデータを適合させようとする記号回帰法の改良について述べる。
これは、通常、ノイズや悪いデータに対して、桁違いに堅牢であることによって、過去の最先端を改善する。
ニューラルネットワークの勾配特性から一般化対称性を発見する手法を開発した。
論文 参考訳(メタデータ) (2020-06-18T18:01:19Z) - The data-driven physical-based equations discovery using evolutionary
approach [77.34726150561087]
与えられた観測データから数学的方程式を発見するアルゴリズムについて述べる。
このアルゴリズムは遺伝的プログラミングとスパース回帰を組み合わせたものである。
解析方程式の発見や偏微分方程式(PDE)の発見にも用いられる。
論文 参考訳(メタデータ) (2020-04-03T17:21:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。