論文の概要: Incorporating Background Knowledge in Symbolic Regression using a
Computer Algebra System
- arxiv url: http://arxiv.org/abs/2301.11919v2
- Date: Thu, 4 May 2023 14:52:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 19:10:36.178104
- Title: Incorporating Background Knowledge in Symbolic Regression using a
Computer Algebra System
- Title(参考訳): コンピュータ代数システムを用いたシンボリック回帰の背景知識の導入
- Authors: Charles Fox, Neil Tran, Nikki Nacion, Samiha Sharlin, and Tyler R.
Josephson
- Abstract要約: シンボリック回帰(SR)は、与えられたデータセットに適合する解釈可能な簡潔な表現を生成することができる。
具体的には、従来の遺伝的アルゴリズム(GA)ベースのSR(PySR)とマルコフ連鎖モンテカルロ(MCMC)ベースのベイズSRアーキテクチャへの制約の追加について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symbolic Regression (SR) can generate interpretable, concise expressions that
fit a given dataset, allowing for more human understanding of the structure
than black-box approaches. The addition of background knowledge (in the form of
symbolic mathematical constraints) allows for the generation of expressions
that are meaningful with respect to theory while also being consistent with
data. We specifically examine the addition of constraints to traditional
genetic algorithm (GA) based SR (PySR) as well as a Markov-chain Monte Carlo
(MCMC) based Bayesian SR architecture (Bayesian Machine Scientist), and apply
these to rediscovering adsorption equations from experimental, historical
datasets. We find that, while hard constraints prevent GA and MCMC SR from
searching, soft constraints can lead to improved performance both in terms of
search effectiveness and model meaningfulness, with computational costs
increasing by about an order-of-magnitude. If the constraints do not correlate
well with the dataset or expected models, they can hinder the search of
expressions. We find Bayesian SR is better these constraints (as the Bayesian
prior) than by modifying the fitness function in the GA
- Abstract(参考訳): シンボリック回帰(SR)は、特定のデータセットに適合する解釈可能な簡潔な表現を生成することができ、ブラックボックスアプローチよりも構造をより人間的に理解することができる。
背景知識の追加(記号的な数学的制約の形で)により、理論に関して意味のある表現の生成が可能となり、データにも一貫性がある。
従来型遺伝的アルゴリズム(ga)に基づくsr(pysr)とマルコフ鎖モンテカルロ(mcmc)に基づくベイズ型srアーキテクチャ(ベイズ機械科学者)への制約の追加を具体的に検討し、実験および歴史的なデータセットから吸着方程式を再発見することに適用する。
その結果,厳密な制約がGAとMCMC SRの探索を妨げているのに対して,ソフトな制約は探索効率とモデル意味性の両面において性能を向上させ,計算コストは1桁程度増加することがわかった。
制約がデータセットや期待モデルとうまく相関しない場合は、表現の検索を妨げる可能性がある。
ベイジアンSRは、GAの適合関数を変更するよりも、(ベイジアン以前のように)これらの制約の方が優れている。
関連論文リスト
- Complexity-Aware Deep Symbolic Regression with Robust Risk-Seeking Policy Gradients [20.941908494137806]
本稿では,データ駆動型数式発見の堅牢性と解釈可能性を高めるための,新しい記号回帰手法を提案する。
DSRは最先端の手法であるDSRの成功にもかかわらず、リカレントニューラルネットワーク上に構築されており、純粋にデータ適合性によってガイドされている。
学習性能を向上させるために,トランスフォーマーとブロードスファーストサーチを併用した。
論文 参考訳(メタデータ) (2024-06-10T19:29:10Z) - On the Performance of Empirical Risk Minimization with Smoothed Data [59.3428024282545]
経験的リスク最小化(Empirical Risk Minimization、ERM)は、クラスがiidデータで学習可能であれば、サブ線形誤差を達成できる。
We show that ERM can able to achieve sublinear error when a class are learnable with iid data。
論文 参考訳(メタデータ) (2024-02-22T21:55:41Z) - Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z) - A Transformer Model for Symbolic Regression towards Scientific Discovery [11.827358526480323]
記号回帰(SR)は、数値データセットを最もよく記述する数学的表現を探索する。
本稿では, シンボリック回帰に着目した新しいトランスフォーマーモデルを提案する。
我々は、正規化ツリーベース編集距離を用いて、最先端の結果を出力するSRSDデータセットにベストモデルを適用した。
論文 参考訳(メタデータ) (2023-12-07T06:27:48Z) - RSRM: Reinforcement Symbolic Regression Machine [13.084113582897965]
本稿では,不足データのみから複雑な数式を解く能力を習得する新しい強化回帰マシンを提案する。
RSRMモデルは,(1)事前定義された数学演算子と変数からなる最適な数学表現木を探索するモンテカルロ木探索 (MCTS) エージェント,(2)報酬の分布を適切に理解してMCTSの検索空間を縮小するダブルQ学習ブロック,(3)新しい数学演算子を蒸留して数学表現木の表現能力を向上する修飾サブツリー探索ブロックの3つの主要なモジュールから構成される。
論文 参考訳(メタデータ) (2023-05-24T02:51:45Z) - Active Learning in Symbolic Regression with Physical Constraints [0.4037357056611557]
進化的記号回帰(SR)は記号方程式をデータに適合させ、簡潔な解釈可能なモデルを与える。
本研究では,身体的制約のあるアクティブな学習環境において,どのデータを収集すべきかをSRを用いて提案する。
論文 参考訳(メタデータ) (2023-05-17T17:07:25Z) - Deep Generative Symbolic Regression with Monte-Carlo-Tree-Search [29.392036559507755]
記号回帰は数値データから記号表現を学習する問題である。
手続き的に生成した合成データセットに基づいてトレーニングされたディープニューラルモデルは、競合性能を示した。
そこで本研究では,モンテカルロ木探索手法に基づいて,両世界の長所を提供する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-02-22T09:10:20Z) - Explainable Sparse Knowledge Graph Completion via High-order Graph
Reasoning Network [111.67744771462873]
本稿では,スパース知識グラフ(KG)のための新しい説明可能なモデルを提案する。
高次推論をグラフ畳み込みネットワーク、すなわちHoGRNに結合する。
情報不足を緩和する一般化能力を向上させるだけでなく、解釈可能性も向上する。
論文 参考訳(メタデータ) (2022-07-14T10:16:56Z) - Multi-task Learning of Order-Consistent Causal Graphs [59.9575145128345]
我々は、$K関連ガウス非巡回グラフ(DAG)の発見問題を考える。
マルチタスク学習環境下では, 線形構造方程式モデルを学習するためのMLE ($l_1/l$-regularized maximum chance estimator) を提案する。
理論的には、関係するタスクにまたがるデータを活用することで、因果順序を復元する際のサンプルの複雑さをより高めることができることを示す。
論文 参考訳(メタデータ) (2021-11-03T22:10:18Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Robust Compressed Sensing using Generative Models [98.64228459705859]
本稿では,Median-of-Means (MOM) にヒントを得たアルゴリズムを提案する。
我々のアルゴリズムは、外れ値が存在する場合でも、重み付きデータの回復を保証する。
論文 参考訳(メタデータ) (2020-06-16T19:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。