論文の概要: Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations
- arxiv url: http://arxiv.org/abs/2603.06869v1
- Date: Fri, 06 Mar 2026 20:42:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.289698
- Title: Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations
- Title(参考訳): 雑音および部分的な観測からゴバニング方程式を発見するための対称性制約付き言語誘導型プログラム合成
- Authors: Mirza Samad Ahmed Baig, Syeda Anshrah Gillani,
- Abstract要約: SymLang (Symmetry-Constrained Language-Guided equation discovery) は3つの異なるアイデアをまとめる統一フレームワークである。
133の力学系において、SymLangは観測ノイズの10%以下で83.7%の正確な構造回復率を達成する。
すべての試験された体制において、この枠組みは構造的縮退を正しく識別し、自信ある1つの方程式を返すのではなく、明確に報告する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discovering compact governing equations from experimental observations is one of the defining objectives of quantitative science, yet practical discovery pipelines routinely fail when measurements are noisy, relevant state variables are unobserved, or multiple symbolic structures explain the data equally well within statistical uncertainty. Here we introduce SymLang (Symmetry-constrained Language-guided equation discovery), a unified framework that brings together three previously separate ideas: (i) typed symmetry-constrained grammars that encode dimensional analysis, group-theoretic invariance, and parity constraints as hard production rules, eliminating on average 71.3% of candidate expression trees before any fitting; (ii) language-model-guided program synthesis in which a fine-tuned 7B-parameter proposer, conditioned on interpretable data descriptors, efficiently navigates the constrained search space; and (iii) MDL-regularized Bayesian model selection coupled with block-bootstrap stability analysis that quantifies structural uncertainty rather than committing to a single best equation. Across 133 dynamical systems spanning classical mechanics, electrodynamics, thermodynamics, population dynamics, and nonlinear oscillators, SymLang achieves an exact structural recovery rate of 83.7% under 10% observational noise - a 22.4 percentage-point improvement over the next-best baseline - while reducing out-of-distribution extrapolation error by 61% and near-eliminating conservation-law violations (3.1 x 10-3 vs. 187.3 x 10-3 physical drift for the closest competitor). In all tested regimes the framework correctly identifies structural degeneracy, reporting it explicitly rather than returning a confidently wrong single equation. The framework is fully open-source and reproducible, providing a principled pathway from raw data to interpretable, physically auditable symbolic laws.
- Abstract(参考訳): 実験観測からコンパクトな支配方程式を発見することは、定量的科学の明確な目的の1つであるが、実際の発見パイプラインは、測定がうるさく、関連する状態変数が観測されない、あるいは複数の記号構造が統計的不確実性の範囲内でデータを等しく説明するときに、日常的に失敗する。
SymLang (Symmetry-Constrained Language-Guided equation discovery)は3つの異なるアイデアをまとめる統合フレームワークである。
一 厳密な生産規則として次元解析、群理論不変性及びパリティ制約を符号化した型付き対称性制約文法で、任意の適合前に、候補表現木の平均71.3%を除去すること。
二 言語モデル誘導型プログラム合成であって、微調整された7Bパラメーターの提案者が解釈可能なデータ記述子に条件付けされ、制約された検索空間を効率的にナビゲートするものであること。
3) MDL正規化ベイズモデル選択とブロック・ブートストラップ安定性解析は, 一つの最良方程式にコミットするのではなく, 構造的不確かさを定量化する。
古典力学、電気力学、熱力学、人口力学、非線形振動子にまたがる133の力学系において、SymLangは83.7%という正確な構造回復率を観測ノイズの10%以下で達成した。
すべての試験された体制において、この枠組みは構造的縮退を正しく識別し、自信ある1つの方程式を返すのではなく、明確に報告する。
このフレームワークは完全にオープンソースで再現可能であり、生データから解釈可能で物理的に監査可能な象徴的法則への原則化された経路を提供する。
関連論文リスト
- Asymptotic Semantic Collapse in Hierarchical Optimization [0.5729426778193398]
マルチエージェント言語システムは、共有された支配的コンテキストが個々の意味論を徐々に吸収する障害モードを示すことができる。
階層最適化における漸近的セマンティック崩壊(Asymptotic Semantic Collapse in Hierarchical Optimization)という名でこの効果を研究する。
我々は、周辺エージェントノードとの繰り返しの相互作用が、グローバルな損失を最小限に抑えるアライメントを駆動していることを示す。
論文 参考訳(メタデータ) (2026-02-01T00:02:01Z) - Knowledge-Informed Kernel State Reconstruction for Interpretable Dynamical System Discovery [46.9843470803458]
MAAT (Model Aware Approximation of Trajectories) は知識情報に基づくカーネル状態再構成に基づくシンボル発見のためのフレームワークである。
下流のシンボルレグレッションで用いられる軌道や微分に対する状態推定MSEを著しく低減する。
論文 参考訳(メタデータ) (2026-01-29T21:15:52Z) - Covariate-assisted Grade of Membership Models via Shared Latent Geometry [0.7939348535496568]
メンバーシップモデルのグレードは、個人レベルの混合メンバーシップスコアを通して多変量カテゴリデータを解析するための柔軟な潜在変数モデルである。
補助共変量体を組み込む従来のアプローチは、一般に完全に指定された関節の確率に依存しており、計算的に集中しており、誤特定に敏感である。
我々は,共変量支援型メンバシップモデルを導入し,共変量情報を統合する。
論文 参考訳(メタデータ) (2026-01-24T02:30:36Z) - Wasserstein Regression as a Variational Approximation of Probabilistic Trajectories through the Bernstein Basis [41.99844472131922]
既存のアプローチは、しばしば確率空間の幾何学を無視したり、計算コストがかかる。
ベルンシュタイン基底を用いた確率軌道のパラメータ化と分布間のワッサーシュタイン距離の最小化を組み合わせた新しい手法を提案する。
この手法は、幾何学的精度、計算的実用性、解釈可能性を組み合わせたものである。
論文 参考訳(メタデータ) (2025-10-30T15:36:39Z) - A Bayesian Framework for Symmetry Inference in Chaotic Attractors [0.0]
候補部分群の格子上での確率的モデル選択として対称性検出を定式化する枠組みを提案する。
人間の歩行力学への応用は、機械的制約によって引き起こされる対称性の変化を明らかにする。
論文 参考訳(メタデータ) (2025-10-18T13:49:35Z) - Dendrograms of Mixing Measures for Softmax-Gated Gaussian Mixture of Experts: Consistency without Model Sweeps [41.371172458797524]
ゲーティングパラメータの共通翻訳、固有のゲート-エキスパート相互作用、およびタイトな数値-デノミネータ結合までの不特定性に対処する。
モデル選択には, 最適なパラメータ率を得る専門家の数を一貫したスイープフリーセレクタとして, デンドログラム誘導SGMoEを適応させる。
干ばつを識別できるトウモロコシの形質のデータセット上で、私たちのデンドログラム誘導SGMoEは2人の専門家を選別し、明確な混合階層を公開し、確率を早期に安定化し、解釈可能な遺伝子型フェノタイプマップを生成する。
論文 参考訳(メタデータ) (2025-10-14T17:23:44Z) - Discovering Governing Equations in the Presence of Uncertainty [11.752763800308276]
本研究では, 力学系を基礎とする支配方程式を一貫して発見する鍵として, 測定ノイズとともに, システムの変動性を考慮した説明が重要であることを理論的に論じる。
SIPは、スパース同定ダイナミクス(SINDy)とその変種に対する平均82%の正方程式を一貫して同定することを示した。
論文 参考訳(メタデータ) (2025-07-13T18:31:25Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Neuro-Symbolic Entropy Regularization [78.16196949641079]
構造化予測では、目的は構造化されたオブジェクトをエンコードする多くの出力変数を共同で予測することである。
エントロピー正則化(Entropy regularization)という1つのアプローチは、決定境界が低確率領域にあるべきであることを示唆している。
我々は、モデルが有効対象を確実に予測することを奨励する損失、ニューロシンボリックエントロピー正規化を提案する。
論文 参考訳(メタデータ) (2022-01-25T06:23:10Z) - Unifying supervised learning and VAEs -- coverage, systematics and
goodness-of-fit in normalizing-flow based neural network models for
astro-particle reconstructions [0.0]
統計的不確実性、包括性、体系的不確実性、あるいは適度な尺度はしばしば計算されない。
データとラベルの共分散のKL分割の目的は、教師付き学習と変分オートエンコーダの統合を可能にすることを示す。
本稿では,特定の「基本順序」輪郭の数値積分を伴わずにカバレッジ確率を計算する方法について論じる。
論文 参考訳(メタデータ) (2020-08-13T11:28:57Z) - Sparse Identification of Nonlinear Dynamical Systems via Reweighted
$\ell_1$-regularized Least Squares [62.997667081978825]
本研究は, 非線形系の制御方程式をノイズ状態測定から復元するための繰り返しスパース規則化回帰法を提案する。
本研究の目的は、状態測定ノイズの存在下での手法の精度とロバスト性を改善することである。
論文 参考訳(メタデータ) (2020-05-27T08:30:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。