論文の概要: SyMANTIC: An Efficient Symbolic Regression Method for Interpretable and Parsimonious Model Discovery in Science and Beyond
- arxiv url: http://arxiv.org/abs/2502.03367v1
- Date: Wed, 05 Feb 2025 17:05:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:26:52.750894
- Title: SyMANTIC: An Efficient Symbolic Regression Method for Interpretable and Parsimonious Model Discovery in Science and Beyond
- Title(参考訳): Symantic: 科学とそれ以上の分野での解釈可能かつパシモニアスなモデル発見のための効率的なシンボリック回帰手法
- Authors: Madhav R. Muthyala, Farshud Sorourifar, You Peng, Joel A. Paulson,
- Abstract要約: シンボリック回帰(SR)アルゴリズムであるSyMANTICを導入する。
Symanticは、多数の候補から低次元記述子を効率的に識別する。
我々はSyMANTICが既存のSR手法のコストのごく一部で類似またはより正確なモデルを明らかにすることを示す。
- 参考スコア(独自算出の注目度): 3.4191590966148824
- License:
- Abstract: Symbolic regression (SR) is an emerging branch of machine learning focused on discovering simple and interpretable mathematical expressions from data. Although a wide-variety of SR methods have been developed, they often face challenges such as high computational cost, poor scalability with respect to the number of input dimensions, fragility to noise, and an inability to balance accuracy and complexity. This work introduces SyMANTIC, a novel SR algorithm that addresses these challenges. SyMANTIC efficiently identifies (potentially several) low-dimensional descriptors from a large set of candidates (from $\sim 10^5$ to $\sim 10^{10}$ or more) through a unique combination of mutual information-based feature selection, adaptive feature expansion, and recursively applied $\ell_0$-based sparse regression. In addition, it employs an information-theoretic measure to produce an approximate set of Pareto-optimal equations, each offering the best-found accuracy for a given complexity. Furthermore, our open-source implementation of SyMANTIC, built on the PyTorch ecosystem, facilitates easy installation and GPU acceleration. We demonstrate the effectiveness of SyMANTIC across a range of problems, including synthetic examples, scientific benchmarks, real-world material property predictions, and chaotic dynamical system identification from small datasets. Extensive comparisons show that SyMANTIC uncovers similar or more accurate models at a fraction of the cost of existing SR methods.
- Abstract(参考訳): 記号回帰(SR)は、データから単純で解釈可能な数学的表現を発見することに焦点を当てた機械学習の新しい分野である。
SR法は多種多様な手法が開発されているが、高い計算コスト、入力次元の数に対するスケーラビリティの低下、ノイズの脆弱性、精度と複雑さのバランスの取れないといった課題に直面していることが多い。
この研究は、これらの課題に対処する新しいSRアルゴリズムであるSyMANTICを導入している。
SyMANTICは、相互情報に基づく特徴選択、適応的特徴拡張、および再帰的に適用される$\ell_0$ベースのスパース回帰のユニークな組み合わせによって、($\sim 10^5$から$\sim 10^{10}$以上の)大きな候補から(潜在的に数個の)低次元記述子を効率的に識別する。
さらに、情報理論の尺度を用いて、パレート最適方程式の近似セットを生成し、それぞれが与えられた複雑性に対して最良の基礎的精度を提供する。
さらに、PyTorchエコシステム上に構築されたSyMANTICのオープンソース実装により、インストールやGPUアクセラレーションが容易になります。
我々は,SyMANTICの有効性を,合成例,科学ベンチマーク,実世界の物質特性予測,小さなデータセットからのカオス力学系同定など,様々な問題に適用した。
大規模な比較では、SyMANTICは既存のSR手法のコストのごく一部で類似またはより正確なモデルを明らかにする。
関連論文リスト
- The Sample Complexity of Online Reinforcement Learning: A Multi-model Perspective [55.15192437680943]
連続状態と行動空間を持つ非線形力学系に対するオンライン強化学習のサンプル複雑性について検討した。
我々のアルゴリズムは、その単純さ、事前知識を組み込む能力、そして良心的な過渡的行動のために、実際に有用である可能性が高い。
論文 参考訳(メタデータ) (2025-01-27T10:01:28Z) - Ab initio nonparametric variable selection for scalable Symbolic Regression with large $p$ [2.222138965069487]
シンボリック回帰(SR)は、データの非線形関係を特徴付けるシンボリック表現を発見するための強力な手法である。
既存のSR法は、多くの入力変数を持つデータセットにスケールしないが、これは現代の科学的応用で一般的である。
本稿では,Ab初期非パラメトリック変数選択とSRを組み合わせたPAN+SRを提案する。
論文 参考訳(メタデータ) (2024-10-17T15:41:06Z) - TorchSISSO: A PyTorch-Based Implementation of the Sure Independence Screening and Sparsifying Operator for Efficient and Interpretable Model Discovery [0.0]
記号回帰(SR)は、代数モデルの構造とパラメータの両方を探索する強力な機械学習手法である。
本稿では、PyTorchフレームワーク上に構築されたPythonネイティブ実装であるTorchSISSOを紹介する。
我々は,TorchSISSOが本来のSISSOの性能と様々なタスクで一致しているか,上回っていることを実証する。
論文 参考訳(メタデータ) (2024-10-02T17:02:17Z) - Discovering symbolic expressions with parallelized tree search [59.92040079807524]
記号回帰は、データから簡潔で解釈可能な数学的表現を発見する能力のおかげで、科学研究において重要な役割を果たす。
既存のアルゴリズムは、複雑性の問題に対処する際の精度と効率の重要なボトルネックに直面してきた。
本稿では,限定データから汎用数学的表現を効率的に抽出する並列木探索(PTS)モデルを提案する。
論文 参考訳(メタデータ) (2024-07-05T10:41:15Z) - BEACON: A Bayesian Optimization Strategy for Novelty Search in Expensive Black-Box Systems [1.204357447396532]
ノベルティ・サーチ (NS) は、シミュレーションや実験を通じて様々なシステムの振る舞いを自動的に発見する探索アルゴリズムのクラスである。
ベイズ最適化の原理にインスパイアされたサンプル効率のNS法を提案する。
BEACONは、限られたサンプリング予算の下で、かなり大きな多様な振る舞いの集合を見出すことで、既存のベースラインを総合的に上回ります。
論文 参考訳(メタデータ) (2024-06-05T20:23:52Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - S$Ω$I: Score-based O-INFORMATION Estimation [7.399561232927219]
S$Omega$I を導入し,システムに関する制約的な仮定を伴わずに初めて O-information を計算できるようにした。
本実験は, 実世界のユースケースにおけるS$Omega$Iの有効性を実証するものである。
論文 参考訳(メタデータ) (2024-02-08T13:38:23Z) - SymbolNet: Neural Symbolic Regression with Adaptive Dynamic Pruning for Compression [1.0356366043809717]
モデル圧縮技術として特別に設計された記号回帰に対するニューラルネットワークアプローチである$ttSymbolNet$を提案する。
このフレームワークは、単一のトレーニングプロセスにおいてモデルウェイト、入力特徴、数学的演算子の動的プルーニングを可能にする。
論文 参考訳(メタデータ) (2024-01-18T12:51:38Z) - Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - Brain Image Synthesis with Unsupervised Multivariate Canonical
CSC$\ell_4$Net [122.8907826672382]
我々は,新しいCSC$ell_4$Netを用いて,イントレとイントラモーダルの両方にまたがる専用特徴を学習することを提案する。
論文 参考訳(メタデータ) (2021-03-22T05:19:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。