論文の概要: Fast Symbolic Regression Benchmarking
- arxiv url: http://arxiv.org/abs/2508.14481v1
- Date: Wed, 20 Aug 2025 07:12:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.369751
- Title: Fast Symbolic Regression Benchmarking
- Title(参考訳): 高速シンボリック回帰ベンチマーク
- Authors: Viktor Martinek,
- Abstract要約: 記号回帰はデータから数学的モデルを明らかにする。
ベンチマークは、"the one"式形式のリカバリを強調し、コンピュータ代数システムにのみ依存する。
我々は、許容可能な表現のキュレートされたリストを導入することで、これらの問題を改善した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Symbolic regression (SR) uncovers mathematical models from data. Several benchmarks have been proposed to compare the performance of SR algorithms. However, existing ground-truth rediscovery benchmarks overemphasize the recovery of "the one" expression form or rely solely on computer algebra systems (such as SymPy) to assess success. Furthermore, existing benchmarks continue the expression search even after its discovery. We improve upon these issues by introducing curated lists of acceptable expressions, and a callback mechanism for early termination. As a starting point, we use the symbolic regression for scientific discovery (SRSD) benchmark problems proposed by Yoshitomo et al., and benchmark the two SR packages SymbolicRegression.jl and TiSR. The new benchmarking method increases the rediscovery rate of SymbolicRegression.jl from 26.7%, as reported by Yoshitomo et at., to 44.7%. Performing the benchmark takes 41.2% less computational expense. TiSR's rediscovery rate is 69.4%, while performing the benchmark saves 63% time.
- Abstract(参考訳): 記号回帰(SR)は、データから数学的モデルを明らかにする。
SRアルゴリズムの性能を比較するために、いくつかのベンチマークが提案されている。
しかし、既存の地味な再検討ベンチマークは、成功を評価するために「1」表現形式の回復を過度に強調するか、コンピュータ代数システム(SymPyなど)にのみ依存している。
さらに、既存のベンチマークでは、発見後も式検索が続けられている。
我々は、許容される表現のキュレートされたリストを導入し、早期終了のためのコールバック機構を導入することにより、これらの問題を改善した。
出発点として,義朝らが提唱したSRSD(SymbolicRegression.jl)とTiSR(TiSR)という2つのSRパッケージのベンチマークを行った。
新しいベンチマーク手法は、SybolicRegression.jlの再粘性率を26.7%から引き上げる。
44.7%であった。
ベンチマークの実行には41.2%の計算コストがかかる。
TiSRの再検査率は69.4%であり、ベンチマークの実行時間は63%である。
関連論文リスト
- Beyond Least Squares: Robust Regression Transformer (R2T) [0.0]
本稿では,変換器エンコーダが数値列を処理し,圧縮NNがシンボルパラメータを予測し,固定されたシンボル方程式が元のシーケンスを再構成するハイブリッド型ニューラルシンボリックアーキテクチャを提案する。
学習目的は、合成データを用いて、非対称な構造雑音を加えて元の配列を復元し、ニューラルネットワークのパラメータ推定によって導かれる記号的フィットを効果的に学習することである。
合成ウェアラブルデータに対する6e-6から3.5e-5の中央値回帰MSEは,ハマーロスやソフトL1のような最小二乗法やロバスト回帰技術と比較して10~300倍改善されている。
論文 参考訳(メタデータ) (2025-08-04T20:03:13Z) - VAR-MATH: Probing True Mathematical Reasoning in Large Language Models via Symbolic Multi-Instance Benchmarks [25.295071827427677]
Emphbenchmarkの汚染は テスト問題の公開によって発生します
評価の脆弱さは、単一インスタンスの評価に依存することに起因する。
IME-MATHは、真の推論能力を調査するために設計されたシンボリック評価フレームワークである。
論文 参考訳(メタデータ) (2025-07-17T08:10:55Z) - RePCS: Diagnosing Data Memorization in LLM-Powered Retrieval-Augmented Generation [0.0]
モデルは依然として記憶されたトレーニングデータに依存し、得られた証拠をバイパスし、汚染された出力を生成する。
RePCS(Retrieval-Path Contamination Scoring)は,モデルアクセスや再トレーニングを必要とせずに,そのような動作を検出する診断手法である。
論文 参考訳(メタデータ) (2025-06-18T14:48:19Z) - Call for Action: towards the next generation of symbolic regression benchmark [2.7253033812941387]
記号回帰は解釈可能な数学的表現を発見するための強力なテクニックである。
SR手法のベンチマークはアルゴリズム、データセット、評価基準の多様性のために依然として難しい。
論文 参考訳(メタデータ) (2025-05-06T21:02:20Z) - End-to-End Implicit Neural Representations for Classification [57.55927378696826]
Inlicit Neural representations (INRs) は、ニューラルネットワークパラメータの信号を符号化し、信号再構成に優れた結果を示す。
INRをベースとした分類は、CNNのようなピクセルベースの手法に比べて、依然としてかなり低性能である。
本研究は,SIRENを学習段階のスキームとともに初期化するエンド・ツー・エンドの戦略を提案する。
論文 参考訳(メタデータ) (2025-03-23T16:02:23Z) - Semi-Parametric Retrieval via Binary Bag-of-Tokens Index [71.78109794895065]
SemI-parametric Disentangled Retrieval (SiDR)は、ニューラルパラメータから検索インデックスを分離するバイエンコーダ検索フレームワークである。
SiDRは、検索のための非パラメトリックトークン化インデックスをサポートし、BM25のようなインデックス化の複雑さを著しく改善した。
論文 参考訳(メタデータ) (2024-05-03T08:34:13Z) - DistilPose: Tokenized Pose Regression with Heatmap Distillation [81.21273854769765]
本研究では,熱マップに基づく手法と回帰に基づく手法のギャップを埋める,DistilPoseと呼ばれる新しいポーズ推定フレームワークを提案する。
DistilPoseは、教師モデル(ヒートマップベース)から生徒モデル(レグレッションベース)への知識伝達を、Token-distilling (TDE) と Simulated Heatmaps を通じて最大化する。
論文 参考訳(メタデータ) (2023-03-04T16:56:29Z) - Towards Improved Room Impulse Response Estimation for Speech Recognition [53.04440557465013]
遠距離場自動音声認識(ASR)におけるブラインドルームインパルス応答(RIR)推定システムを提案する。
まず、改良されたRIR推定と改善されたASR性能の関連性について、ニューラルネットワークを用いたRIR推定器の評価を行った。
次に、残響音声からRIR特徴を符号化し、符号化された特徴からRIRを構成するGANベースのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-08T00:40:27Z) - Reducing Variance in Temporal-Difference Value Estimation via Ensemble
of Deep Networks [109.59988683444986]
MeanQは単純なアンサンブル法であり、ターゲット値をアンサンブル平均として推定する。
本稿では,Atari Learning Environmentベンチマークを用いた実験において,MeanQが顕著なサンプル効率を示すことを示す。
論文 参考訳(メタデータ) (2022-09-16T01:47:36Z) - GSR: A Generalized Symbolic Regression Approach [13.606672419862047]
本論文では, 一般化記号回帰について述べる。
GSR法は、よく知られたシンボリック回帰ベンチマーク問題セットにおいて、最先端のいくつかの手法よりも優れていることを示す。
既存のベンチマークと比較して、より困難な新しいSRベンチマークセットであるSymSetを導入することで、GSRの強みを強調します。
論文 参考訳(メタデータ) (2022-05-31T07:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。