論文の概要: Discovering Mathematical Equations with Diffusion Language Model
- arxiv url: http://arxiv.org/abs/2509.13136v1
- Date: Tue, 16 Sep 2025 14:53:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.132829
- Title: Discovering Mathematical Equations with Diffusion Language Model
- Title(参考訳): 拡散言語モデルを用いた数学的方程式の発見
- Authors: Xiaoxu Han, Chengzhen Ning, Jinghui Zhong, Fubiao Yang, Yu Wang, Xin Mu,
- Abstract要約: 本稿では,連続状態拡散言語モデルに基づくシンボル回帰のための事前学習フレームワークであるDiffuSRを紹介する。
DrouSRは、離散的な数学的シンボルを連続的な潜在空間にマッピングするために、拡散過程内にトレーニング可能な埋め込み層を用いる。
また,拡散型方程式生成器の精度を高めるための効果的な推論戦略を設計する。
- 参考スコア(独自算出の注目度): 6.384075523245284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discovering valid and meaningful mathematical equations from observed data plays a crucial role in scientific discovery. While this task, symbolic regression, remains challenging due to the vast search space and the trade-off between accuracy and complexity. In this paper, we introduce DiffuSR, a pre-training framework for symbolic regression built upon a continuous-state diffusion language model. DiffuSR employs a trainable embedding layer within the diffusion process to map discrete mathematical symbols into a continuous latent space, modeling equation distributions effectively. Through iterative denoising, DiffuSR converts an initial noisy sequence into a symbolic equation, guided by numerical data injected via a cross-attention mechanism. We also design an effective inference strategy to enhance the accuracy of the diffusion-based equation generator, which injects logit priors into genetic programming. Experimental results on standard symbolic regression benchmarks demonstrate that DiffuSR achieves competitive performance with state-of-the-art autoregressive methods and generates more interpretable and diverse mathematical expressions.
- Abstract(参考訳): 観測データから有効で有意義な数学的方程式を発見することは、科学的発見において重要な役割を担っている。
このタスクはシンボリック回帰であり、膨大な検索スペースと精度と複雑さのトレードオフのために依然として困難である。
本稿では,連続状態拡散言語モデルに基づくシンボル回帰のための事前学習フレームワークであるDiffuSRを紹介する。
DiffuSRは拡散過程にトレーニング可能な埋め込み層を用い、離散的な数学的シンボルを連続的な潜在空間にマッピングし、方程式の分布を効果的にモデル化する。
繰り返し denoising を通じて、DiffuSR は初期雑音列を、クロスアテンション機構を介して注入される数値データによって導かれるシンボリック方程式に変換する。
また、遺伝的プログラミングにロジット先行を注入する拡散型方程式生成器の精度を高める効果的な推論戦略を設計する。
標準記号回帰ベンチマークの実験結果は、DiffuSRが最先端の自己回帰手法と競合し、より解釈可能で多様な数学的表現を生成することを示した。
関連論文リスト
- Data-Efficient Symbolic Regression via Foundation Model Distillation [34.0701397977874]
EQUATEは、蒸留を通じて低データ状態における記号方程式の発見に基礎モデルを適用するフレームワークである。
精度と堅牢性の両方において、最先端のベースラインを一貫して上回る。
これらの結果は、データ効率のシンボリックレグレッションのための実用的で一般化可能なソリューションとして、EQUATEを強調している。
論文 参考訳(メタデータ) (2025-08-27T00:18:48Z) - On the Trajectory Regularity of ODE-based Diffusion Sampling [79.17334230868693]
拡散に基づく生成モデルは微分方程式を用いて、複素データ分布と抽出可能な事前分布の間の滑らかな接続を確立する。
本稿では,拡散モデルのODEに基づくサンプリングプロセスにおいて,いくつかの興味深い軌道特性を同定する。
論文 参考訳(メタデータ) (2024-05-18T15:59:41Z) - Convergence Analysis of Discrete Diffusion Model: Exact Implementation
through Uniformization [17.535229185525353]
連続マルコフ連鎖の均一化を利用したアルゴリズムを導入し、ランダムな時間点の遷移を実装した。
我々の結果は、$mathbbRd$における拡散モデルの最先端の成果と一致し、さらに$mathbbRd$設定と比較して離散拡散モデルの利点を浮き彫りにする。
論文 参考訳(メタデータ) (2024-02-12T22:26:52Z) - Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z) - A Geometric Perspective on Diffusion Models [57.27857591493788]
本稿では,人気のある分散拡散型SDEのODEに基づくサンプリングについて検討する。
我々は、最適なODEベースのサンプリングと古典的な平均シフト(モード探索)アルゴリズムの理論的関係を確立する。
論文 参考訳(メタデータ) (2023-05-31T15:33:16Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。