論文の概要: Hierarchical Bayesian Operator-induced Symbolic Regression Trees for Structural Learning of Scientific Expressions
- arxiv url: http://arxiv.org/abs/2509.19710v1
- Date: Wed, 24 Sep 2025 02:42:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.670823
- Title: Hierarchical Bayesian Operator-induced Symbolic Regression Trees for Structural Learning of Scientific Expressions
- Title(参考訳): 階層的ベイズ演算子による記号的回帰木による科学表現の構造学習
- Authors: Somjit Roy, Pritam Dey, Debdeep Pati, Bani K. Mallick,
- Abstract要約: 我々は,木構造的記号表現のアンサンブルとして科学法則を表す記号回帰の階層的ベイズ的枠組みを開発する。
我々はベイズ後部濃度の最小値に近い値を確立し、シンボル回帰の文脈で最初の厳密な保証を提供する。
実験的な評価は,提案手法の最先端の競合モジュールに対する堅牢な性能を示す。
- 参考スコア(独自算出の注目度): 3.8545239266455185
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advent of Scientific Machine Learning has heralded a transformative era in scientific discovery, driving progress across diverse domains. Central to this progress is uncovering scientific laws from experimental data through symbolic regression. However, existing approaches are dominated by heuristic algorithms or data-hungry black-box methods, which often demand low-noise settings and lack principled uncertainty quantification. Motivated by interpretable Statistical Artificial Intelligence, we develop a hierarchical Bayesian framework for symbolic regression that represents scientific laws as ensembles of tree-structured symbolic expressions endowed with a regularized tree prior. This coherent probabilistic formulation enables full posterior inference via an efficient Markov chain Monte Carlo algorithm, yielding a balance between predictive accuracy and structural parsimony. To guide symbolic model selection, we develop a marginal posterior-based criterion adhering to the Occam's window principle and further quantify structural fidelity to ground truth through a tailored expression-distance metric. On the theoretical front, we establish near-minimax rate of Bayesian posterior concentration, providing the first rigorous guarantee in context of symbolic regression. Empirical evaluation demonstrates robust performance of our proposed methodology against state-of-the-art competing modules on a simulated example, a suite of canonical Feynman equations, and single-atom catalysis dataset.
- Abstract(参考訳): 科学機械学習の出現は、科学的発見の変革の時代を告げ、様々な領域で進歩を加速させた。
この進歩の中心は、象徴的回帰を通じて実験データから科学的法則を明らかにすることである。
しかし、既存のアプローチはヒューリスティックアルゴリズムや、低ノイズ設定を要求されることが多く、原理的な不確実性定量化が欠如しているブラックボックス法に支配されている。
解釈可能な統計的人工知能によってモチベーションを得た、科学的な法則を表す記号回帰のための階層的ベイズ的枠組みを、前述した正規化木を付加した木構造的記号表現のアンサンブルとして開発する。
このコヒーレント確率的定式化は、効率的なマルコフ連鎖モンテカルロアルゴリズムによる完全な後部推論を可能にし、予測精度と構造的パーシモニーのバランスを与える。
記号モデル選択を導くために,オッカムの窓の原理に忠実に固執する境界後部基準を開発し,さらに表現距離の調整によって構造的忠実度を基底真実に定量化する。
理論的には、ベイズ後部濃度の最小値に近い値を確立し、シンボル回帰の文脈で最初の厳密な保証を提供する。
模擬例,標準ファインマン方程式スイート,単原子触媒データセットを用いて,提案手法の最先端モジュールに対するロバストな性能を実証した。
関連論文リスト
- Bayesian symbolic regression: Automated equation discovery from a physicists' perspective [0.0]
記号回帰は、データから閉形式の数学的モデルを学習するプロセスを自動化する。
シンボリック回帰に対する標準的なアプローチは、モデル選択基準、正規化のアプローチ、モデル空間の探索に依存する。
本稿では,確率論的アプローチが基本的考察と明示的な近似からモデル妥当性を確立する方法を示す。
論文 参考訳(メタデータ) (2025-07-22T17:53:15Z) - Cycle-Consistent Helmholtz Machine: Goal-Seeded Simulation via Inverted Inference [5.234742752529437]
emphCycle-Consistent Helmholtz Machine (C$2$HM)を紹介する。
C$2$HM reframes inference as a emphgoal-seeded, emphasymmetric process grounded in structureed internal priors。
古典的償却推論に代わる生物学的にインスパイアされた代替手段を提供することにより、$C2$HMは生成モデリングを意図的シミュレーションとして再考する。
論文 参考訳(メタデータ) (2025-07-03T17:24:27Z) - Equivariant Representation Learning for Symmetry-Aware Inference with Guarantees [20.285132886770146]
本稿では,回帰,条件付き確率推定,不確実性定量化を同時に扱う同変表現学習フレームワークを提案する。
演算子と群表現論を基礎として,条件付き期待演算子のスペクトル分解を近似する。
人工データセットと実世界のロボット工学の応用に関する実証的な評価は、我々のアプローチの可能性を裏付けるものである。
論文 参考訳(メタデータ) (2025-05-26T10:47:23Z) - The Foundations of Tokenization: Statistical and Computational Concerns [51.370165245628975]
トークン化は、NLPパイプラインにおける重要なステップである。
NLPにおける標準表現法としての重要性は認識されているが、トークン化の理論的基盤はまだ完全には理解されていない。
本稿では,トークン化モデルの表現と解析のための統一的な形式的枠組みを提案することによって,この理論的ギャップに対処することに貢献している。
論文 参考訳(メタデータ) (2024-07-16T11:12:28Z) - A Recursive Bateson-Inspired Model for the Generation of Semantic Formal
Concepts from Spatial Sensory Data [77.34726150561087]
本稿では,複雑な感覚データから階層構造を生成するための記号のみの手法を提案する。
このアプローチは、概念や概念の創始の鍵としてのバテソンの差異の概念に基づいている。
このモデルは、トレーニングなしでかなりリッチだが人間に読まれる概念表現を生成することができる。
論文 参考訳(メタデータ) (2023-07-16T15:59:13Z) - Parsimonious Inference [0.0]
parsimonious inferenceは任意のアーキテクチャ上の推論の情報理論的な定式化である。
提案手法は,効率的な符号化と巧妙なサンプリング戦略を組み合わせて,クロスバリデーションを伴わない予測アンサンブルを構築する。
論文 参考訳(メタデータ) (2021-03-03T04:13:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。