論文の概要: Beyond Error-Based Optimization: Experience-Driven Symbolic Regression with Goal-Conditioned Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2601.14693v1
- Date: Wed, 21 Jan 2026 06:08:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.255001
- Title: Beyond Error-Based Optimization: Experience-Driven Symbolic Regression with Goal-Conditioned Reinforcement Learning
- Title(参考訳): 誤りに基づく最適化を超えて:ゴール・コンディション強化学習による経験駆動型シンボリック回帰
- Authors: Jianwen Sun, Xinrui Li, Fuqing Li, Xiaoxuan Shen,
- Abstract要約: EGRL-SR(Experience-driven Goal- Conditioned Reinforcement Learning for Regression)という新しいフレームワークを提案する。
目標条件付き強化学習問題として記号回帰を定式化し、後続経験リプレイを取り入れた。
我々は、低エラー表現よりも構造パターンに注目するアクション値ネットワークを奨励する、全点満足度二項報酬関数を設計する。
- 参考スコア(独自算出の注目度): 14.473539776112666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Symbolic Regression aims to automatically identify compact and interpretable mathematical expressions that model the functional relationship between input and output variables. Most existing search-based symbolic regression methods typically rely on the fitting error to inform the search process. However, in the vast expression space, numerous candidate expressions may exhibit similar error values while differing substantially in structure, leading to ambiguous search directions and hindering convergence to the underlying true function. To address this challenge, we propose a novel framework named EGRL-SR (Experience-driven Goal-conditioned Reinforcement Learning for Symbolic Regression). In contrast to traditional error-driven approaches, EGRL-SR introduces a new perspective: leveraging precise historical trajectories and optimizing the action-value network to proactively guide the search process, thereby achieving a more robust expression search. Specifically, we formulate symbolic regression as a goal-conditioned reinforcement learning problem and incorporate hindsight experience replay, allowing the action-value network to generalize common mapping patterns from diverse input-output pairs. Moreover, we design an all-point satisfaction binary reward function that encourages the action-value network to focus on structural patterns rather than low-error expressions, and concurrently propose a structure-guided heuristic exploration strategy to enhance search diversity and space coverage. Experiments on public benchmarks show that EGRL-SR consistently outperforms state-of-the-art methods in recovery rate and robustness, and can recover more complex expressions under the same search budget. Ablation results validate that the action-value network effectively guides the search, with both the reward function and the exploration strategy playing critical roles.
- Abstract(参考訳): 記号回帰は、入力変数と出力変数の関数関係をモデル化するコンパクトで解釈可能な数学的表現を自動的に識別することを目的としている。
既存の検索ベースシンボリック回帰法は、通常、探索過程を知らせるためにフィッティングエラーに依存する。
しかし、膨大な表現空間において、多くの候補表現は、構造的にはかなり異なるが、類似した誤り値を示し、あいまいな探索方向を導き、基礎となる真の関数への収束を妨げる。
この課題に対処するため、我々はEGRL-SR(Experience-driven Goal-conditioned Reinforcement Learning for Symbolic Regression)という新しいフレームワークを提案する。
従来のエラー駆動アプローチとは対照的に、EGRL-SRは、正確な履歴軌跡を活用し、アクション値ネットワークを最適化し、探索プロセスを積極的にガイドし、より堅牢な表現探索を実現するという、新しい視点を導入している。
具体的には、目標条件付き強化学習問題としてシンボル回帰を定式化し、後続経験リプレイを導入し、アクション値ネットワークが様々な入力-出力ペアから共通マッピングパターンを一般化できるようにする。
さらに、低エラー表現よりも構造パターンに注目する行動価値ネットワークを奨励する全点満足度二項報酬関数を設計し、探索の多様性と空間カバレッジを高めるための構造誘導型ヒューリスティック探索戦略を同時に提案する。
公開ベンチマークの実験では、EGRL-SRは回復率とロバスト性において最先端の手法を一貫して上回り、同じ検索予算の下でより複雑な表現を復元できることを示した。
その結果、行動価値ネットワークは、報酬関数と探索戦略の両方が重要な役割を果たすことにより、探索を効果的に導くことが確認された。
関連論文リスト
- Current Challenges of Symbolic Regression: Optimization, Selection, Model Simplification, and Benchmarking [0.0]
記号回帰(SR)は、変数間の関係を記述する数学的表現を見つけることを目的としている。
現在の手法はSRの景観を理解するために常に再評価されなければならない。
この論文は、博士課程全体で行われた一連の研究を通じて、これらの課題に対処する。
論文 参考訳(メタデータ) (2025-12-01T13:48:07Z) - Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - VAR: Visual Attention Reasoning via Structured Search and Backtracking [49.427842994857635]
構造化された検索としてグラウンドド推論をリキャストするフレームワークであるVisual Attention Reasoningを紹介する。
VARは、推論プロセスを2つの重要な段階に分解する。
我々は、我々の7BモデルであるVAR-7Bが、幻覚と安全性のベンチマークの包括的なスイートに新しい最先端を設定していることを示します。
論文 参考訳(メタデータ) (2025-10-21T13:18:44Z) - Towards Context-aware Reasoning-enhanced Generative Searching in E-commerce [61.03081096959132]
そこで本稿では,複雑な状況下でのテキストバウンダリングを改善するための,文脈対応推論強化型生成検索フレームワークを提案する。
提案手法は,強力なベースラインに比べて優れた性能を示し,検索に基づく推薦の有効性を検証した。
論文 参考訳(メタデータ) (2025-10-19T16:46:11Z) - RE-Searcher: Robust Agentic Search with Goal-oriented Planning and Self-reflection [55.125987985864896]
環境の複雑さが脆弱な探索行動をいかに引き起こすかを定量的に分析する。
本稿では,検索エージェントRE-Searcherのインスタンス化をシンプルかつ効果的に行う手法を提案する。
この目標指向計画と自己回帰の組み合わせにより、RE-Searcherは複雑な検索環境における急激な手がかりに抵抗することができる。
論文 参考訳(メタデータ) (2025-09-30T10:25:27Z) - Improving Monte Carlo Tree Search for Symbolic Regression [13.641201012951356]
記号回帰は、望ましい目的を満たす簡潔で解釈可能な数学的表現を見つけることを目的としている。
2つの重要な革新を通じてこれらの制限に対処するシンボリックレグレッションのための改良されたフレームワークを提案する。
本手法は, 回復率の観点から, 最先端ライブラリと競合する性能を達成し, 精度とモデル複雑性の両面において良好な位置を占める。
論文 参考訳(メタデータ) (2025-09-19T12:36:05Z) - Sparse Interpretable Deep Learning with LIES Networks for Symbolic Regression [22.345828337550575]
記号回帰は、データを正確に記述する閉形式の数学的表現を発見することを目的としている。
既存のSR手法は、しばしば人口に基づく探索や自己回帰モデリングに依存している。
LIES(Logarithm, Identity, Exponential, Sine)は,シンボル表現のモデル化に最適化された,解釈可能なプリミティブアクティベーションを備えたニューラルネットワークアーキテクチャである。
論文 参考訳(メタデータ) (2025-06-09T22:05:53Z) - iEBAKER: Improved Remote Sensing Image-Text Retrieval Framework via Eliminate Before Align and Keyword Explicit Reasoning [80.44805667907612]
iEBAKERは、弱い相関のサンプルペアをフィルタリングする革新的な戦略である。
SAR(Sort After Reversed Retrieval)戦略の代替として,SAR(Sort After Retrieval)戦略を導入する。
キーワード明示型推論(KER)モジュールを組み込んで、微妙なキー概念の区別による有益な影響を促進する。
論文 参考訳(メタデータ) (2025-04-08T03:40:19Z) - Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。