論文の概要: Curiosity-driven RL for symbolic equation solving
- arxiv url: http://arxiv.org/abs/2510.17022v1
- Date: Sun, 19 Oct 2025 22:04:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.253231
- Title: Curiosity-driven RL for symbolic equation solving
- Title(参考訳): シンボリック方程式解のための好奇性駆動RL
- Authors: Kevin P. O Keeffe,
- Abstract要約: 我々は、好奇心に基づく探索とグラフに基づく行動で非線形方程式を解くことができるモデルフリーなPPO citeschulman 2017 Proximal augmentedを示す。
我々の研究は好奇心に基づく探索が一般的なシンボリック推論タスクに役立つことを示唆している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We explore if RL can be useful for symbolic mathematics. Previous work showed contrastive learning can solve linear equations in one variable. We show model-free PPO \cite{schulman2017proximal} augmented with curiosity-based exploration and graph-based actions can solve nonlinear equations such as those involving radicals, exponentials, and trig functions. Our work suggests curiosity-based exploration may be useful for general symbolic reasoning tasks.
- Abstract(参考訳): RLが記号数学に有用かどうかを探る。
従来の研究では、対照的な学習は1変数の線形方程式を解くことができることを示した。
モデルのない PPO \cite{schulman2017proximal} に好奇性に基づく探索とグラフに基づく作用を付加することにより、ラジカル、指数関数、トリグ関数などの非線形方程式を解くことができることを示す。
我々の研究は好奇心に基づく探索が一般的なシンボリック推論タスクに役立つことを示唆している。
関連論文リスト
- Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z) - Towards true discovery of the differential equations [57.089645396998506]
微分方程式探索は、解釈可能なモデルを開発するために使用される機械学習サブフィールドである。
本稿では,専門家の入力を伴わない独立方程式発見のための前提条件とツールについて検討する。
論文 参考訳(メタデータ) (2023-08-09T12:03:12Z) - Neural Symbolic Regression that Scales [58.45115548924735]
本稿では,大規模事前学習を利用した最初の記号回帰手法を提案する。
我々は,非有界な方程式の集合を手続き的に生成し,同時にインプット・アウトプット・ペアの集合からシンボル方程式を予測するためにトランスフォーマーを事前訓練する。
論文 参考訳(メタデータ) (2021-06-11T14:35:22Z) - A Neuro-Symbolic Method for Solving Differential and Functional
Equations [6.899578710832262]
微分方程式を解くために記号式を生成する方法を提案する。
既存の手法とは異なり、このシステムは記号数学よりも言語モデルを学習する必要はない。
我々は,他の数学的課題に対するシンボリックな解を見つけるために,システムがいかに懸命に一般化されるかを示す。
論文 参考訳(メタデータ) (2020-11-04T17:13:25Z) - Learning Dexterous Manipulation from Suboptimal Experts [69.8017067648129]
相対エントロピーQラーニング(Relative Entropy Q-Learning、REQ)は、オフラインおよび従来のRLアルゴリズムのアイデアを組み合わせた単純なポリシーアルゴリズムである。
本稿では、REQが、デモから一般の政治外RL、オフラインRL、およびRLにどのように有効であるかを示す。
論文 参考訳(メタデータ) (2020-10-16T18:48:49Z) - The data-driven physical-based equations discovery using evolutionary
approach [77.34726150561087]
与えられた観測データから数学的方程式を発見するアルゴリズムについて述べる。
このアルゴリズムは遺伝的プログラミングとスパース回帰を組み合わせたものである。
解析方程式の発見や偏微分方程式(PDE)の発見にも用いられる。
論文 参考訳(メタデータ) (2020-04-03T17:21:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。