論文の概要: Lessons on Datasets and Paradigms in Machine Learning for Symbolic Computation: A Case Study on CAD
- arxiv url: http://arxiv.org/abs/2401.13343v2
- Date: Thu, 20 Jun 2024 10:32:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-22 05:38:47.966362
- Title: Lessons on Datasets and Paradigms in Machine Learning for Symbolic Computation: A Case Study on CAD
- Title(参考訳): 記号計算のための機械学習におけるデータセットとパラダイムの学習:CADを事例として
- Authors: Tereso del Río, Matthew England,
- Abstract要約: 本研究では,機械学習に先立ってデータセットを分析することの重要性について報告する。
本稿では, 筒状代数分解に対する変数順序付けの選択について, 特定のケーススタディに対する結果を示す。
我々は、データセットのバランスとさらなる拡張を可能にするシステムのための拡張技術を導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symbolic Computation algorithms and their implementation in computer algebra systems often contain choices which do not affect the correctness of the output but can significantly impact the resources required: such choices can benefit from having them made separately for each problem via a machine learning model. This study reports lessons on such use of machine learning in symbolic computation, in particular on the importance of analysing datasets prior to machine learning and on the different machine learning paradigms that may be utilised. We present results for a particular case study, the selection of variable ordering for cylindrical algebraic decomposition, but expect that the lessons learned are applicable to other decisions in symbolic computation. We utilise an existing dataset of examples derived from applications which was found to be imbalanced with respect to the variable ordering decision. We introduce an augmentation technique for polynomial systems problems that allows us to balance and further augment the dataset, improving the machine learning results by 28\% and 38\% on average, respectively. We then demonstrate how the existing machine learning methodology used for the problem $-$ classification $-$ might be recast into the regression paradigm. While this does not have a radical change on the performance, it does widen the scope in which the methodology can be applied to make choices.
- Abstract(参考訳): 記号計算アルゴリズムとその計算機代数系における実装は、しばしば出力の正しさに影響を与えず、必要なリソースに大きな影響を与える選択を含む:そのような選択は、機械学習モデルを介して各問題に対して個別に行うことで恩恵を受けることができる。
本研究は, 記号計算における機械学習の利用, 特に, 機械学習に先立ってデータセットを分析することの重要性, 活用可能なさまざまな機械学習パラダイムについて述べる。
本稿では, 筒状代数分解における変数順序付けの選択について検討するが, 学習結果が記号計算における他の決定にも適用可能であることを期待する。
変数順序決定に関して不均衡であることがわかったアプリケーションから抽出したサンプルの既存のデータセットを利用する。
多項式系問題に対する拡張手法を導入し、データセットのバランスとさらなる拡張を可能にし、機械学習の結果を平均28\%、38\%改善する。
次に、既存の機械学習手法で問題に使用される$-$分類が回帰パラダイムに再キャストされる可能性を実証する。
これはパフォーマンスに根本的な変化はないが、選択のために方法論が適用可能な範囲を広げている。
関連論文リスト
- Learning Linear Attention in Polynomial Time [115.68795790532289]
線形注意を持つ単層変圧器の学習性に関する最初の結果を提供する。
線形アテンションは RKHS で適切に定義された線形予測器とみなすことができる。
我々は,すべての経験的リスクが線形変換器と同等のトレーニングデータセットを効率的に識別する方法を示す。
論文 参考訳(メタデータ) (2024-10-14T02:41:01Z) - Controlling dynamical systems to complex target states using machine
learning: next-generation vs. classical reservoir computing [68.8204255655161]
機械学習を用いた非線形力学系の制御は、システムを周期性のような単純な振る舞いに駆動するだけでなく、より複雑な任意の力学を駆動する。
まず, 従来の貯水池計算が優れていることを示す。
次のステップでは、これらの結果を異なるトレーニングデータに基づいて比較し、代わりに次世代貯水池コンピューティングを使用する別のセットアップと比較する。
その結果、通常のトレーニングデータに対して同等のパフォーマンスを提供する一方で、次世代RCは、非常に限られたデータしか利用できない状況において、著しくパフォーマンスが向上していることがわかった。
論文 参考訳(メタデータ) (2023-07-14T07:05:17Z) - Data Augmentation for Mathematical Objects [0.0]
非線形問題のデータセットと, 筒状分解のための変数順序付けを選択する問題を考える。
すでにラベル付けされた問題に変数名を入れ替えることで、さらにラベル付けを必要としない新しい問題インスタンスを生成します。
その結果,MLの精度は平均63%向上した。
論文 参考訳(メタデータ) (2023-07-13T16:02:45Z) - Explainable AI Insights for Symbolic Computation: A case study on
selecting the variable ordering for cylindrical algebraic decomposition [0.0]
本稿では、このような機械学習モデルに説明可能なAI(XAI)技術を用いることで、記号計算に新たな洞察を与えることができるかどうかを考察する。
本稿では、円筒代数分解の変数順序付けをMLを用いて選択するケーススタディを提案する。
論文 参考訳(メタデータ) (2023-04-24T15:05:04Z) - Revisiting Variable Ordering for Real Quantifier Elimination using
Machine Learning [0.7388859384645262]
我々は、バイアスを取り除くように設計された41K以上のMetiTarski課題を含む新しいデータセットを作成するために対称性を適用した。
情報漏洩の問題を評価し、新しいデータセット上でモデルの一般化可能性をテストする。
論文 参考訳(メタデータ) (2023-02-27T18:48:33Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - GENEOnet: A new machine learning paradigm based on Group Equivariant
Non-Expansive Operators. An application to protein pocket detection [97.5153823429076]
グループ同変非拡張演算子に基づく新しい計算パラダイムを導入する。
我々は、薬物設計における重要な問題として、ホスト可能なタンパク質の表面のポケットを検出する、GENEOnetと呼ばれる方法を試した。
論文 参考訳(メタデータ) (2022-01-31T11:14:51Z) - How to effectively use machine learning models to predict the solutions
for optimization problems: lessons from loss function [0.0]
本稿では,高度な機械学習手法を用いた制約最適化問題に対する良質な解の予測を目的とする。
citeabbasi 2020predictingの仕事を拡張し、大規模最適化モデルのソリューションを予測するために機械学習モデルを使用する。
論文 参考訳(メタデータ) (2021-05-14T02:14:00Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z) - An analysis on the use of autoencoders for representation learning:
fundamentals, learning task case studies, explainability and challenges [11.329636084818778]
多くの機械学習タスクでは、データの優れた表現を学ぶことが、優れたパフォーマンスのソリューションを構築するための鍵となる。
可視化のためのデータ埋め込み,画像認識,セマンティックハッシュ,異常行動の検出,インスタンス生成など,一連の学習課題を提示する。
オートエンコーダを唯一の学習方法として用いた各タスクに対して,解を提案する。
論文 参考訳(メタデータ) (2020-05-21T08:41:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。