論文の概要: Learning First Integrals via Backward-Generated Data and Guided Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2605.21160v1
- Date: Wed, 20 May 2026 13:27:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.695553
- Title: Learning First Integrals via Backward-Generated Data and Guided Reinforcement Learning
- Title(参考訳): 逆生成データとガイド付き強化学習による初等積分の学習
- Authors: Jingfeng Zhong, Zhengxiang Liu, Zhijie Wang, Shuai Li,
- Abstract要約: 既存の記号計算ツールとLarge Language Models (LLM) は、最初の積分の発見に限られている。
本稿では,この課題に対処するために開発された LLM ベースの解法 FIr を提案する。
直観(微分方程式,第一積分)ペアの大規模データセットを構築する「逆生成」アルゴリズムを導入する。
実験により、FIrは計算コストを大幅に削減するが、より大きな数学的LLMや商用の解法よりも大幅に優れていることが示された。
- 参考スコア(独自算出の注目度): 7.891851139983605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The discovery of first integrals is of fundamental scientific importance for understanding conservation laws in dynamical systems. However, existing symbolic computation tools and Large Language Models (LLMs) remain limited on this task because high-quality training data are scarce and successful solutions often depend on mathematical intuition. This paper presents FISolver, an LLM-based solver developed to address this challenge. First, we introduce a "Backward Generation" algorithm that systematically builds large-scale datasets of (differential equation, first integral) pairs by deriving differential equations from sampled integrals, thereby alleviating the data scarcity bottleneck. Second, we apply supervised fine-tuning to a compact mathematical model and further improve its performance through reinforcement learning with a Levenshtein Distance-based shaped reward. In addition, we design data synthesis and blending strategies that support effective adaptation to difficult problem families from sparse examples. Experiments show that FISolver, while requiring substantially lower computational cost, significantly outperforms larger mathematical LLMs and commercial solvers such as Mathematica on challenging benchmarks, indicating a new data-driven route for automated discovery of first integrals.
- Abstract(参考訳): 第一積分の発見は、力学系の保存則を理解するための基本的な科学的重要性である。
しかし,既存の記号計算ツールやLarge Language Models (LLMs) は,高品質なトレーニングデータが少ないため,数学的な直観に依存することが多い。
本稿では,この課題に対処するために開発された LLM ベースの解法である FISolver を提案する。
まず、サンプル積分から微分方程式を導出することにより、大規模(微分方程式、第一積分)ペアのデータセットを体系的に構築し、データの不足ボトルネックを軽減する「後方生成」アルゴリズムを提案する。
第二に、教師付き微調整をコンパクトな数学的モデルに適用し、Levenshtein Distance を用いた強化学習により、さらなる性能向上を図る。
さらに,難解な問題族への効果的な適応を支援するデータ合成とブレンディング戦略を,スパース例から設計する。
実験の結果、FISolver は計算コストを大幅に下げる必要があるが、Mathematica のようなより大きな数学的 LLM や商業的解法よりもはるかに優れており、第一積分の自動発見のための新しいデータ駆動経路が示されている。
関連論文リスト
- Bidirectional Curriculum Generation: A Multi-Agent Framework for Data-Efficient Mathematical Reasoning [16.95900718416944]
各トレーニングサンプルの教育的価値を最大化するために,新しい双方向カリキュラム生成フレームワークを導入する。
剛性軌道とは異なり、我々のマルチエージェントエコシステムは適応的な教育を模倣し、閉じたフィードバックループを確立する。
このメカニズムは、モデルが任意の段階で最も効果的なデータのみを消費することを保証します。
論文 参考訳(メタデータ) (2026-03-05T12:49:21Z) - Bridging the Domain Gap in Equation Distillation with Reinforcement Feedback [37.06543502352577]
データ2Eqnタスクの基本モデルのドメイン適応性を高めるための強化学習に基づく微調整フレームワークを提案する。
提案手法により,モデルが特定の複雑なデータ分布に適応し,数学的に意味のある方程式を生成することができる。
論文 参考訳(メタデータ) (2025-05-21T14:25:41Z) - RV-Syn: Rational and Verifiable Mathematical Reasoning Data Synthesis based on Structured Function Library [58.404895570822184]
RV-Synは、新しい数学的合成手法である。
このライブラリからPython形式の関数を組み合わせることで、グラフをソリューションとして生成する。
構築したグラフに基づいて,解誘導論理認識問題生成を実現する。
論文 参考訳(メタデータ) (2025-04-29T04:42:02Z) - Advancing Mathematical Reasoning in Language Models: The Impact of Problem-Solving Data, Data Synthesis Methods, and Training Stages [13.377908992869814]
問題解決データは、一般的な数学的コーパスと比較してモデルの数学的能力を大幅に向上させる。
本研究では, 効果的なデータ合成手法を同定し, チュータシップ増幅合成法が最高の性能を発揮することを示す。
論文 参考訳(メタデータ) (2025-01-23T12:14:57Z) - AlphaIntegrator: Transformer Action Search for Symbolic Integration Proofs [3.618534280726541]
本稿では, ステップバイステップの数学的統合のための, 最初の正解学習システムを提案する。
鍵となる考え方は、正しい数学的統合ルールの探索を導くGPTトランスフォーマーモデルで表されるポリシーを学ぶことである。
本稿では,数式に対する公理的に正しい作用を持つシンボリックエンジンと,ステップバイステップ統合のための最初のデータセットを紹介する。
論文 参考訳(メタデータ) (2024-10-03T16:50:30Z) - Discovering physical laws with parallel symbolic enumeration [67.36739393470869]
並列記号列挙法(PSE)を導入し,限られたデータから汎用数学的表現を効率的に抽出する。
実験の結果,PSEは最先端のベースラインアルゴリズムと比較して精度が高く,計算速度も速いことがわかった。
PSEは、記号的、解釈可能なモデルの正確で効率的なデータ駆動による発見の進歩を表している。
論文 参考訳(メタデータ) (2024-07-05T10:41:15Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - AttNS: Attention-Inspired Numerical Solving For Limited Data Scenarios [51.94807626839365]
限定データによる微分方程式の解法として,注目型数値解法(AttNS)を提案する。
AttNSは、モデル一般化とロバスト性の向上におけるResidual Neural Networks(ResNet)のアテンションモジュールの効果にインスパイアされている。
論文 参考訳(メタデータ) (2023-02-05T01:39:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。