論文の概要: Overcoming error-in-variable problem in data-driven model discovery by orthogonal distance regression
- arxiv url: http://arxiv.org/abs/2507.23426v1
- Date: Thu, 31 Jul 2025 11:06:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:09.608148
- Title: Overcoming error-in-variable problem in data-driven model discovery by orthogonal distance regression
- Title(参考訳): 直交距離回帰法によるデータ駆動モデル探索における誤り不変問題の克服
- Authors: Lloyd Fung,
- Abstract要約: 我々はODR-BINDyと呼ばれる新しいモデル発見法を提案し、その性能を現在のSINDy変種と比較した。
以上の結果から,ODR-BINDyはスパースやノイズの多いデータセットから正しいモデルを復元する上で,既存の手法を一貫して上回っていることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Despite the recent proliferation of machine learning methods like SINDy that promise automatic discovery of governing equations from time-series data, there remain significant challenges to discovering models from noisy datasets. One reason is that the linear regression underlying these methods assumes that all noise resides in the training target (the regressand), which is the time derivative, whereas the measurement noise is in the states (the regressors). Recent methods like modified-SINDy and DySMHO address this error-in-variable problem by leveraging information from the model's temporal evolution, but they are also imposing the equation as a hard constraint, which effectively assumes no error in the regressand. Without relaxation, this hard constraint prevents assimilation of data longer than Lyapunov time. Instead, the fulfilment of the model equation should be treated as a soft constraint to account for the small yet critical error introduced by numerical truncation. The uncertainties in both the regressor and the regressand invite the use of orthogonal distance regression (ODR). By incorporating ODR with the Bayesian framework for model selection, we introduce a novel method for model discovery, termed ODR-BINDy, and assess its performance against current SINDy variants using the Lorenz63, Rossler, and Van Der Pol systems as case studies. Our findings indicate that ODR-BINDy consistently outperforms all existing methods in recovering the correct model from sparse and noisy datasets. For instance, our ODR-BINDy method reliably recovers the Lorenz63 equation from data with noise contamination levels of up to 30%.
- Abstract(参考訳): SINDyのような最近の機械学習手法の普及は、時系列データから支配方程式を自動的に発見することを約束しているが、ノイズの多いデータセットからモデルを見つける上で大きな課題は残る。
これらの手法の根底にある線形回帰は、全てのノイズが時間微分であるトレーニングターゲット(回帰器)に存在すると仮定するのに対し、測定ノイズは状態(回帰器)にあると仮定する。
修正SINDyやDySMHOのような最近の手法は、モデルの時間的進化からの情報を活用することで、この誤りに対処するが、彼らはこの方程式をハード制約として含み、回帰の誤差を効果的に仮定している。
緩和がなければ、この制約はリャプノフ時間よりも長いデータの同化を防ぐ。
代わりに、モデル方程式の充足は、数値的トランケーションによってもたらされる小さな臨界誤差を考慮に入れたソフト制約として扱われるべきである。
回帰器と回帰器の両方の不確かさは、直交距離回帰(ODR)の使用を誘致する。
モデル選択のためのODRをベイズ的フレームワークに組み込むことにより、ODR-BINDyと呼ばれる新しいモデル発見法を導入し、ロレンツ63, Rossler, Van Der Pol システムをケーススタディとして、現在の SINDy 変種に対してその性能を評価する。
以上の結果から,ODR-BINDyはスパースやノイズの多いデータセットから正しいモデルを復元する上で,既存の手法を一貫して上回っていることが示唆された。
例えば、ODR-BINDy法は騒音汚染レベルが最大30%のデータからロレンツ63方程式を確実に回収する。
関連論文リスト
- Bayesian Model Parameter Learning in Linear Inverse Problems: Application in EEG Focal Source Imaging [49.1574468325115]
逆問題は、関心のシグナルを直接観測できない限定データ問題として記述することができる。
未知の非線形モデルパラメータを含む線形逆問題について検討した。
ベイズモデルに基づく学習手法を用いて,信号の回復とモデルパラメータの推定を行った。
論文 参考訳(メタデータ) (2025-01-07T18:14:24Z) - Data Augmentation with Variational Autoencoder for Imbalanced Dataset [1.2289361708127877]
不均衡分布からの学習は予測モデリングにおいて大きな課題となる。
VAEとスムーズなブートストラップを組み合わせた新しいデータ生成手法を開発し,IRの課題に対処する。
論文 参考訳(メタデータ) (2024-12-09T22:59:03Z) - Discovery and inversion of the viscoelastic wave equation in inhomogeneous media [3.6864706261549127]
現在のスパース回帰法はスパースおよびノイズデータセット上の不正確な方程式を特定することができる。
探索と埋め込みという2つの交互方向最適化フェーズを組み合わせたハイブリッドフレームワークを提案する。
提案手法は, 高レベルの騒音に直面しても, 優れたロバスト性と精度を示す。
論文 参考訳(メタデータ) (2024-09-27T01:05:45Z) - Hierarchical model reduction driven by machine learning for parametric
advection-diffusion-reaction problems in the presence of noisy data [0.0]
本稿では,雑音データの存在下でのパラメトリック楕円問題に対する信頼度低減モデルを生成するための新しい手法を提案する。
ノイズの影響を受ければ,方向方向のHiPODの精度が低下することを示す。
我々は、無関係なノイズからデータ中の関連する物理的特徴をよりよく識別する機械学習フィッティングモデルに取って代わる。
論文 参考訳(メタデータ) (2022-04-01T16:02:05Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - A Hypergradient Approach to Robust Regression without Correspondence [85.49775273716503]
本稿では,入力データと出力データとの対応が不十分な回帰問題について考察する。
ほとんどの既存手法はサンプルサイズが小さい場合にのみ適用できる。
シャッフル回帰問題に対する新しい計算フレームワークであるROBOTを提案する。
論文 参考訳(メタデータ) (2020-11-30T21:47:38Z) - Sparsely constrained neural networks for model discovery of PDEs [0.0]
本稿では,任意のスパース回帰手法を用いて,ディープラーニングに基づくサロゲートのスパースパターンを決定するモジュラーフレームワークを提案する。
異なるネットワークアーキテクチャと疎度推定器がモデル発見精度と収束性を,いくつかのベンチマーク例でどのように改善するかを示す。
論文 参考訳(メタデータ) (2020-11-09T11:02:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。