論文の概要: SymMatika: Structure-Aware Symbolic Discovery
- arxiv url: http://arxiv.org/abs/2507.03110v1
- Date: Thu, 03 Jul 2025 18:32:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.580697
- Title: SymMatika: Structure-Aware Symbolic Discovery
- Title(参考訳): SymMatika: 構造を意識したシンボリックディスカバリ
- Authors: Michael Scherk, Boyuan Chen,
- Abstract要約: 記号回帰は、観測データを記述する閉形式の数学的表現を復元しようとする。
本稿では、遺伝的プログラミング(GP)と、生物学的配列解析にインスパイアされた再利用可能なモチーフライブラリを組み合わせたハイブリッドSRアルゴリズムであるSymMatikaを紹介する。
最先端の回復率を達成し、以前のNguyenの最良の結果よりも5.1%高いパフォーマンス、Nguyen-12の最初のリカバリ、Feynman方程式の競合性能を達成している。
- 参考スコア(独自算出の注目度): 3.470709890025438
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Symbolic regression (SR) seeks to recover closed-form mathematical expressions that describe observed data. While existing methods have advanced the discovery of either explicit mappings (i.e., $y = f(\mathbf{x})$) or discovering implicit relations (i.e., $F(\mathbf{x}, y)=0$), few modern and accessible frameworks support both. Moreover, most approaches treat each expression candidate in isolation, without reusing recurring structural patterns that could accelerate search. We introduce SymMatika, a hybrid SR algorithm that combines multi-island genetic programming (GP) with a reusable motif library inspired by biological sequence analysis. SymMatika identifies high-impact substructures in top-performing candidates and reintroduces them to guide future generations. Additionally, it incorporates a feedback-driven evolutionary engine and supports both explicit and implicit relation discovery using implicit-derivative metrics. Across benchmarks, SymMatika achieves state-of-the-art recovery rates, achieving 5.1% higher performance than the previous best results on Nguyen, the first recovery of Nguyen-12, and competitive performance on the Feynman equations. It also recovers implicit physical laws from Eureqa datasets up to $100\times$ faster. Our results demonstrate the power of structure-aware evolutionary search for scientific discovery. To support broader research in interpretable modeling and symbolic discovery, we have open-sourced the full SymMatika framework.
- Abstract(参考訳): 記号回帰(SR)は、観測データを記述する閉形式の数学的表現を復元しようとする。
既存の手法では明示的な写像(例えば $y = f(\mathbf{x})$)の発見や暗黙的な関係(例えば $F(\mathbf{x}, y)=0$)の発見が進んでいるが、近代的およびアクセス可能なフレームワークはどちらもサポートしていない。
さらに、ほとんどのアプローチでは、検索を加速する構造パターンを再利用することなく、各表現候補を分離して扱う。
生物配列解析にインスパイアされた多島遺伝的プログラミング(GP)と再利用可能なモチーフライブラリを組み合わせたハイブリッドSRアルゴリズムであるSymMatikaを紹介する。
SymMatikaは、トップパフォーマンス候補におけるハイインパクトなサブ構造を特定し、将来の世代を導くためにそれらを再導入する。
さらに、フィードバック駆動の進化エンジンが組み込まれており、暗黙の派生指標を使用した明示的および暗黙的な関係発見の両方をサポートする。
ベンチマーク全体では、SymMatikaは最先端の回復率を達成し、以前のNguyenの最良の結果よりも5.1%高いパフォーマンス、Nguyen-12の最初のリカバリ、Feynman方程式の競合性能を達成している。
また、Eureqaデータセットから最大100\times$高速に暗黙の物理法則を回復する。
本研究は, 科学的発見のための構造認識進化探索の力を実証するものである。
解釈可能なモデリングとシンボリックディスカバリに関する広範な研究を支援するため、私たちはSymMatikaフレームワークをオープンソース化しました。
関連論文リスト
- SymDiff: Equivariant Diffusion via Stochastic Symmetrisation [28.614292092399563]
対称性の枠組みを用いた同変拡散モデル構築手法であるSymDiffを提案する。
SymDiffは、サンプリング時にデプロイされる学習データ拡張に似ており、軽量で、計算効率が高く、任意のオフザシェルフモデル上に実装が容易である。
論文 参考訳(メタデータ) (2024-10-08T18:02:29Z) - Discovering physical laws with parallel combinatorial tree search [57.05912962368898]
記号回帰は、データから簡潔で解釈可能な数学的表現を発見する能力のおかげで、科学研究において重要な役割を果たす。
既存のアルゴリズムは10年以上にわたって精度と効率の重大なボトルネックに直面してきた。
制約データから汎用数学的表現を効率的に抽出する並列木探索(PCTS)モデルを提案する。
論文 参考訳(メタデータ) (2024-07-05T10:41:15Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Deep Generative Symbolic Regression with Monte-Carlo-Tree-Search [29.392036559507755]
記号回帰は数値データから記号表現を学習する問題である。
手続き的に生成した合成データセットに基づいてトレーニングされたディープニューラルモデルは、競合性能を示した。
そこで本研究では,モンテカルロ木探索手法に基づいて,両世界の長所を提供する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-02-22T09:10:20Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - uGLAD: Sparse graph recovery by optimizing deep unrolled networks [11.48281545083889]
深層ネットワークを最適化してスパースグラフ復元を行う新しい手法を提案する。
我々のモデルであるuGLADは、最先端モデルGLADを教師なし設定に構築し、拡張します。
我々は, 遺伝子調節ネットワークから生成した合成ガウスデータ, 非ガウスデータを用いて, モデル解析を行い, 嫌気性消化の事例研究を行った。
論文 参考訳(メタデータ) (2022-05-23T20:20:27Z) - DASHA: Distributed Nonconvex Optimization with Communication
Compression, Optimal Oracle Complexity, and No Client Synchronization [77.34726150561087]
我々は,分散最適化問題に対する新しい手法であるDASHAを開発し,解析する。
MARINAとは異なり、新しいDASHAとDASHA-MVRは圧縮ベクターのみを送信し、ノードを同期しないため、学習をより実用的なものにしている。
論文 参考訳(メタデータ) (2022-02-02T20:10:40Z) - A Precise Performance Analysis of Support Vector Regression [105.94855998235232]
我々は,n$の線形測定に応用したハードおよびソフトサポートベクター回帰法について検討した。
得られた結果は、ハードおよびソフトサポートベクトル回帰アルゴリズムの設計に介入するパラメータを最適に調整するために使用される。
論文 参考訳(メタデータ) (2021-05-21T14:26:28Z) - AI Feynman 2.0: Pareto-optimal symbolic regression exploiting graph
modularity [8.594811303203581]
本稿では,Pareto-Optimal式にデータを適合させようとする記号回帰法の改良について述べる。
これは、通常、ノイズや悪いデータに対して、桁違いに堅牢であることによって、過去の最先端を改善する。
ニューラルネットワークの勾配特性から一般化対称性を発見する手法を開発した。
論文 参考訳(メタデータ) (2020-06-18T18:01:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。