論文の概要: Prior-Guided Symbolic Regression: Towards Scientific Consistency in Equation Discovery
- arxiv url: http://arxiv.org/abs/2602.13021v1
- Date: Fri, 13 Feb 2026 15:26:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:54.009215
- Title: Prior-Guided Symbolic Regression: Towards Scientific Consistency in Equation Discovery
- Title(参考訳): 先導的シンボリック回帰 : 方程式発見における科学的整合性を目指して
- Authors: Jing Xiao, Xinhai Chen, Jiaming Peng, Qinglin Wang, Menghan Jia, Zhiquan Lai, Guangping Yu, Dongsheng Li, Tiejun Li, Jie Liu,
- Abstract要約: シンボリック回帰は、観測データから解釈可能な方程式を発見することを目的としている。
既存のアプローチは擬似方程式(Pseudo-Equation Trap)に該当する: 観察によく適合するが、科学的原理と矛盾しない方程式を生成する。
ウォームアップ,進化,改良からなる3段階パイプライン上に構築された,事前誘導型SRフレームワークPG-SRを提案する。
- 参考スコア(独自算出の注目度): 27.671771941043954
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symbolic Regression (SR) aims to discover interpretable equations from observational data, with the potential to reveal underlying principles behind natural phenomena. However, existing approaches often fall into the Pseudo-Equation Trap: producing equations that fit observations well but remain inconsistent with fundamental scientific principles. A key reason is that these approaches are dominated by empirical risk minimization, lacking explicit constraints to ensure scientific consistency. To bridge this gap, we propose PG-SR, a prior-guided SR framework built upon a three-stage pipeline consisting of warm-up, evolution, and refinement. Throughout the pipeline, PG-SR introduces a prior constraint checker that explicitly encodes domain priors as executable constraint programs, and employs a Prior Annealing Constrained Evaluation (PACE) mechanism during the evolution stage to progressively steer discovery toward scientifically consistent regions. Theoretically, we prove that PG-SR reduces the Rademacher complexity of the hypothesis space, yielding tighter generalization bounds and establishing a guarantee against pseudo-equations. Experimentally, PG-SR outperforms state-of-the-art baselines across diverse domains, maintaining robustness to varying prior quality, noisy data, and data scarcity.
- Abstract(参考訳): シンボリック回帰(SR)は、観測データから解釈可能な方程式を発見し、自然現象の背後にある基本原理を明らかにすることを目的としている。
しかしながら、既存のアプローチは、しばしば擬式トラップ(Pseudo-Equation Trap)に該当する: 観測によく適合する方程式を生成するが、基本的な科学的原理と矛盾しない。
主な理由は、これらのアプローチが科学的一貫性を確保するための明示的な制約を欠いた経験的リスク最小化によって支配されているためである。
このギャップを埋めるために、ウォームアップ、進化、洗練からなる3段階パイプライン上に構築された事前誘導SRフレームワークPG-SRを提案する。
PG-SRは、パイプライン全体を通じて、ドメインの事前値を実行可能な制約プログラムとして明示的にエンコードする事前制約チェッカーを導入し、進化段階において、段階的に科学的に一貫した領域への発見を促進するために、事前アニーリング制約評価(PACE)メカニズムを採用している。
理論的には、PG-SRは仮説空間のラデマッハ複雑性を減少させ、より厳密な一般化境界を与え、擬方程式に対する保証を確立する。
実験的に、PG-SRは様々な領域で最先端のベースラインを上回り、事前品質、ノイズの多いデータ、データ不足に頑健さを維持している。
関連論文リスト
- Near-Constant Strong Violation and Last-Iterate Convergence for Online CMDPs via Decaying Safety Margins [31.581870065866568]
制約付きマルコフ決定過程(CMDP)における安全なオンライン強化学習を,強い後悔と違反の指標の下で研究する。
サブリニアの強い報酬を後悔させる既存の原始二重法は、強い制約違反の増大を招いたり、あるいは固有振動による平均点収束に制限されたりしている。
本稿では,マルチ正規化探索(FlexDOME)アルゴリズムによるフレキシブルセーフティドメイン最適化を提案する。
論文 参考訳(メタデータ) (2026-02-11T14:54:26Z) - Efficient Thought Space Exploration through Strategic Intervention [54.35208611253168]
本稿では,この知見を2つの相乗的コンポーネントを通して操作するHint-Practice Reasoning(HPR)フレームワークを提案する。
フレームワークの中核となる革新は、動的に介入点を識別する分散不整合低減(DIR)である。
算術的および常識的推論ベンチマークによる実験は、HPRの最先端の効率-精度トレードオフを実証している。
論文 参考訳(メタデータ) (2025-11-13T07:26:01Z) - Rediscovering Entropy Regularization: Adaptive Coefficient Unlocks Its Potential for LLM Reinforcement Learning [55.59724323303857]
本稿では,3つのコンポーネントによる探索と利用のバランスをとるフレームワークを提案する。
複数の数学的推論ベンチマークの実験は、AERが一貫してベースラインを上回り、推論精度と探索能力の両方を改善していることを示している。
論文 参考訳(メタデータ) (2025-10-13T03:10:26Z) - Policy Gradient for LQR with Domain Randomization [25.387541996071093]
ドメインランダム化(DR)は、シミュレーション環境の分布に基づいて、コントローラをトレーニングすることで、sim-to-real転送を可能にする。
ドメインランダム化線形二次規則(LQR)のためのポリシー勾配法(PG法)の第1収束解析を提供する。
我々は,サンプル平均値と集団レベルの目標値の差を小さくすることに伴う試料複雑度を定量化する。
論文 参考訳(メタデータ) (2025-03-31T17:51:00Z) - Rethinking State Disentanglement in Causal Reinforcement Learning [78.12976579620165]
因果性は、根底にある状態が識別可能性によって一意に回復できることを保証するための厳密な理論的支援を提供する。
我々はこの研究ラインを再考し、RL固有のコンテキストを取り入れることで、潜在状態に対する以前の識別可能性分析における不要な仮定を低減できることを示した。
本稿では, 従来手法の複雑な構造制約を, 遷移と報酬保存の2つの簡単な制約に置き換えることにより, 一般に部分的に観測可能なマルコフ決定過程(POMDP)を提案する。
論文 参考訳(メタデータ) (2024-08-24T06:49:13Z) - Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning [62.81324245896717]
我々はC-PGと呼ばれる探索非依存のアルゴリズムを導入し、このアルゴリズムは(弱)勾配支配仮定の下でのグローバルな最終点収束を保証する。
制約付き制御問題に対して,我々のアルゴリズムを数値的に検証し,それらを最先端のベースラインと比較する。
論文 参考訳(メタデータ) (2024-07-15T14:54:57Z) - Safe Reinforcement Learning in Tensor Reproducing Kernel Hilbert Space [9.823296458696882]
伝統的な部分的に観察可能なマルコフ決定プロセスでは、安全を確保するには、一般に潜伏状態の信念を推定する必要がある。
本稿では,RLの安全性を,未知のシステム力学の面においてほぼ確実に保証するモデルに基づくアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-01T17:01:37Z) - The Eigenlearning Framework: A Conservation Law Perspective on Kernel
Regression and Wide Neural Networks [1.6519302768772166]
テストリスクとカーネルリッジ回帰の他の一般化指標について、簡単なクローズドフォーム推定を導出する。
関数の正規直交基底を学習するKRRの能力を制限するシャープな保存法則を同定する。
論文 参考訳(メタデータ) (2021-10-08T06:32:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。