論文の概要: Breaking the Data Barrier in Learning Symbolic Computation: A Case Study on Variable Ordering Suggestion for Cylindrical Algebraic Decomposition
- arxiv url: http://arxiv.org/abs/2601.13731v1
- Date: Tue, 20 Jan 2026 08:40:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.230337
- Title: Breaking the Data Barrier in Learning Symbolic Computation: A Case Study on Variable Ordering Suggestion for Cylindrical Algebraic Decomposition
- Title(参考訳): 記号計算学習におけるデータバリアの破壊--円筒型代数的解法における可変順序の提案を事例として-
- Authors: Rui-Juan Jing, Yuegang Zhao, Changbo Chen,
- Abstract要約: 記号計算は、正確な深層計算による数学的推論において重要な応用である。
既存の学習ベースのアプローチは、最高の専門家ベースの方法と競合するだけです。
我々は、大量の注釈付きデータを簡単に取得できる一連の密結合タスクを設計する。
一般公開されたCAD注文データセットの実験では、新しいモデルによって予測される順序は、提案されるものよりもはるかに良いことが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Symbolic computation, powered by modern computer algebra systems, has important applications in mathematical reasoning through exact deep computations. The efficiency of symbolic computation is largely constrained by such deep computations in high dimension. This creates a fundamental barrier on labelled data acquisition if leveraging supervised deep learning to accelerate symbolic computation. Cylindrical algebraic decomposition (CAD) is a pillar symbolic computation method for reasoning with first-order logic formulas over reals with many applications in formal verification and automatic theorem proving. Variable orderings have a huge impact on its efficiency. Impeded by the difficulty to acquire abundant labelled data, existing learning-based approaches are only competitive with the best expert-based heuristics. In this work, we address this problem by designing a series of intimately connected tasks for which a large amount of annotated data can be easily obtained. We pre-train a Transformer model with these data and then fine-tune it on the datasets for CAD ordering. Experiments on publicly available CAD ordering datasets show that on average the orderings predicted by the new model are significantly better than those suggested by the best heuristic methods.
- Abstract(参考訳): 記号計算は、現代の計算機代数システムを利用しており、正確な深層計算による数学的推論において重要な応用がある。
記号計算の効率は、高次元の深い計算によって大きく制約される。
これにより、教師付きディープラーニングを活用してシンボリック計算を高速化する場合、ラベル付きデータ取得に根本的な障壁が生じる。
シリンダ代数分解(CAD、Cylindrical algebraic decomposition)は、実数上の一階論理式を推論するための柱記号計算法であり、形式的検証や自動定理証明に多くの応用がある。
可変順序付けはその効率に大きな影響を及ぼす。
豊富なラベル付きデータを取得することの難しさによって、既存の学習ベースのアプローチは、最高の専門家ベースのヒューリスティックと競争するのみである。
本研究では,大量のアノテートデータを容易に取得できる一連の密結合タスクを設計することで,この問題に対処する。
これらのデータでTransformerモデルを事前トレーニングし、CAD注文用のデータセットに微調整します。
CADオーダリングデータセットの公開実験により、新しいモデルによって予測される順序は、最良のヒューリスティックな手法によって提案されるものよりもはるかに優れていることが示された。
関連論文リスト
- RV-Syn: Rational and Verifiable Mathematical Reasoning Data Synthesis based on Structured Function Library [58.404895570822184]
RV-Synは、新しい数学的合成手法である。
このライブラリからPython形式の関数を組み合わせることで、グラフをソリューションとして生成する。
構築したグラフに基づいて,解誘導論理認識問題生成を実現する。
論文 参考訳(メタデータ) (2025-04-29T04:42:02Z) - Discovering physical laws with parallel symbolic enumeration [67.36739393470869]
並列記号列挙法(PSE)を導入し,限られたデータから汎用数学的表現を効率的に抽出する。
実験の結果,PSEは最先端のベースラインアルゴリズムと比較して精度が高く,計算速度も速いことがわかった。
PSEは、記号的、解釈可能なモデルの正確で効率的なデータ駆動による発見の進歩を表している。
論文 参考訳(メタデータ) (2024-07-05T10:41:15Z) - In-Database Data Imputation [0.6157028677798809]
データの欠落は多くの領域で広く問題となり、データ分析と意思決定の課題を生み出します。
不完全なレコードを除外したり、単純な見積もりを示唆するといった、欠落したデータを扱う従来の手法は、計算的に効率的であるが、バイアスを導入し、変数の関係を乱す可能性がある。
モデルベースの計算手法は、データの変動性と関係を保存し、より堅牢なソリューションを提供するが、彼らは計算時間をはるかに多く要求する。
この作業は、広く使われているMICE方式を用いて、データベースシステム内の効率的で高品質でスケーラブルなデータ計算を可能にする。
論文 参考訳(メタデータ) (2024-01-07T01:57:41Z) - Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z) - Revisiting Variable Ordering for Real Quantifier Elimination using
Machine Learning [0.7388859384645262]
我々は、バイアスを取り除くように設計された41K以上のMetiTarski課題を含む新しいデータセットを作成するために対称性を適用した。
情報漏洩の問題を評価し、新しいデータセット上でモデルの一般化可能性をテストする。
論文 参考訳(メタデータ) (2023-02-27T18:48:33Z) - Berrut Approximated Coded Computing: Straggler Resistance Beyond
Polynomial Computing [34.69732430310801]
本稿では,ストラグラー効果に対処する代替手法として,Berrut Approximated Coded Computing (BACC)を提案する。
BACCは計算複雑性が低い数値的に安定であることが証明されている。
特に、BACCは、サーバのクラスタ上でディープニューラルネットワークをトレーニングするために使用される。
論文 参考訳(メタデータ) (2020-09-17T14:23:38Z) - Learning Generalized Relational Heuristic Networks for Model-Agnostic
Planning [29.714818991696088]
本稿では,記号的行動モデルが存在しない場合の一般化を学習するための新しいアプローチを開発する。
データの効率的で一般化可能な学習を容易にするために、抽象状態表現を使用する。
論文 参考訳(メタデータ) (2020-07-10T06:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。