論文の概要: Symbolic Regression via Control Variable Genetic Programming
- arxiv url: http://arxiv.org/abs/2306.08057v1
- Date: Thu, 25 May 2023 04:11:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-18 12:09:42.719785
- Title: Symbolic Regression via Control Variable Genetic Programming
- Title(参考訳): 制御可変遺伝的プログラミングによる記号回帰
- Authors: Nan Jiang, Yexiang Xue
- Abstract要約: 多くの独立変数に対するシンボリック回帰のための制御変数遺伝プログラミング(CVGP)を提案する。
CVGPは、カスタマイズされた実験設計によりシンボル表現の発見を高速化する。
CVGPをインクリメンタル・ビルディング・アプローチとして示し,表現のクラスを学習する際,探索空間を指数関数的に削減できることを示した。
- 参考スコア(独自算出の注目度): 24.408477700506907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning symbolic expressions directly from experiment data is a vital step
in AI-driven scientific discovery. Nevertheless, state-of-the-art approaches
are limited to learning simple expressions. Regressing expressions involving
many independent variables still remain out of reach. Motivated by the control
variable experiments widely utilized in science, we propose Control Variable
Genetic Programming (CVGP) for symbolic regression over many independent
variables. CVGP expedites symbolic expression discovery via customized
experiment design, rather than learning from a fixed dataset collected a
priori. CVGP starts by fitting simple expressions involving a small set of
independent variables using genetic programming, under controlled experiments
where other variables are held as constants. It then extends expressions
learned in previous generations by adding new independent variables, using new
control variable experiments in which these variables are allowed to vary.
Theoretically, we show CVGP as an incremental building approach can yield an
exponential reduction in the search space when learning a class of expressions.
Experimentally, CVGP outperforms several baselines in learning symbolic
expressions involving multiple independent variables.
- Abstract(参考訳): 実験データから直接シンボル表現を学習することは、AIによる科学的発見の重要なステップである。
それでも、最先端のアプローチは単純な表現の学習に限られている。
多くの独立変数を含む表現の回帰は、まだ手が届かないままである。
科学で広く利用されている制御変数実験により,多くの独立変数に対するシンボリック回帰のための制御変数遺伝的プログラミング(CVGP)を提案する。
CVGPは、事前収集された固定データセットから学ぶのではなく、カスタマイズされた実験設計によってシンボル表現の発見を高速化する。
CVGPは、遺伝的プログラミングを用いて、他の変数が定数として保持される制御された実験において、少数の独立変数を含む単純な表現を適合させることから始まる。
そして、新しい独立変数を追加することで、前世代で学んだ式を拡張し、これらの変数を変更できる新しい制御変数実験を使用する。
理論的には、CVGPをインクリメンタルなビルディングアプローチとして示し、表現のクラスを学ぶ際に探索空間を指数関数的に減少させることができる。
CVGPは、複数の独立変数を含むシンボリック表現の学習において、いくつかのベースラインを上回っている。
関連論文リスト
- Unsupervised Representation Learning from Sparse Transformation Analysis [79.94858534887801]
本稿では,潜在変数のスパース成分への変換を分解し,シーケンスデータから表現を学習することを提案する。
入力データは、まず潜伏活性化の分布として符号化され、その後確率フローモデルを用いて変換される。
論文 参考訳(メタデータ) (2024-10-07T23:53:25Z) - Multi-View Symbolic Regression [1.2334534968968969]
複数のデータセットを同時に考慮したMvSR(Multi-View Symbolic Regression)を提案する。
MvSRは評価された式を各独立したデータセットに適合させ、パラメトリック関数のファミリーを返す。
我々は、既知の表現から生成されたデータと、天文学、化学、経済から得られた実世界のデータを用いて、MvSRの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-06T15:53:49Z) - Data-driven path collective variables [0.0]
本稿では,集合変数の生成,最適化,比較のための新しい手法を提案する。
結果として得られる集合変数は1次元、解釈可能、微分可能である。
2つの異なるアプリケーションに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2023-12-21T14:07:47Z) - Vertical Symbolic Regression [18.7083987727973]
実験データから記号表現を学ぶことは、AIによる科学的発見の重要なステップである。
シンボルレグレッションの迅速化を目的とした垂直回帰(VSR)を提案する。
論文 参考訳(メタデータ) (2023-12-19T08:55:47Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。
そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。
また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:59:06Z) - Scalable Neural Symbolic Regression using Control Variables [7.725394912527969]
本稿では,制御変数を利用したスケーラブルなシンボル回帰モデルであるScaleSRを提案し,精度とスケーラビリティを両立させる。
まず、ディープニューラルネットワーク(DNN)を用いて観測データからデータジェネレータを学習する。
実験結果から,複数の変数を持つ数学的表現の発見において,提案した ScaleSR は最先端のベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-06-07T18:30:25Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Collective variable discovery in the age of machine learning: reality,
hype and everything in between [0.0]
分子動力学シミュレーションは、生体分子の運動力学と分子認識を理解するために日常的に用いられている。
物理化学において、これらの低次元変数はしばしば集合変数と呼ばれる。
本稿では、幾何学的変数から抽象変数まで、よく使われる集合変数のいくつかのニュアンスについて紹介する。
論文 参考訳(メタデータ) (2021-12-06T17:58:53Z) - MURAL: An Unsupervised Random Forest-Based Embedding for Electronic
Health Record Data [59.26381272149325]
異なる変数型でデータを表現するための教師なしランダムフォレストを提案する。
muraL forestsは、ノード分割変数がランダムに選択される一連の決定ツリーで構成されている。
提案手法を用いることで,競合するアプローチよりも正確なデータの視覚化と分類が可能であることを示す。
論文 参考訳(メタデータ) (2021-11-19T22:02:21Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。