論文の概要: Ill-Conditioning in Dictionary-Based Dynamic-Equation Learning: A Systems Biology Case Study
- arxiv url: http://arxiv.org/abs/2603.11330v1
- Date: Wed, 11 Mar 2026 21:42:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.662627
- Title: Ill-Conditioning in Dictionary-Based Dynamic-Equation Learning: A Systems Biology Case Study
- Title(参考訳): 辞書に基づく動的方程式学習におけるIll-conditioning:システム生物学のケーススタディ
- Authors: Yuxiang Feng, Niall M Mangan, Manu Jayadharan,
- Abstract要約: システム生物学のベンチマークモデルを用いて, 条件が生体動態の同定にどう影響するかを示す。
スパースベースは不調な条件を常に解決せず,単項ライブラリよりも性能が劣ることを示す。
- 参考スコア(独自算出の注目度): 2.1795865731681903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data-driven discovery of governing equations from time-series data provides a powerful framework for understanding complex biological systems. Library-based approaches that use sparse regression over candidate functions have shown considerable promise, but they face a critical challenge when candidate functions become strongly correlated: numerical ill-conditioning. Poor or restricted sampling, together with particular choices of candidate libraries, can produce strong multicollinearity and numerical instability. In such cases, measurement noise may lead to widely different recovered models, obscuring the true underlying dynamics and hindering accurate system identification. Although sparse regularization promotes parsimonious solutions and can partially mitigate conditioning issues, strong correlations may persist, regularization may bias the recovered models, and the regression problem may remain highly sensitive to small perturbations in the data. We present a systematic analysis of how ill-conditioning affects sparse identification of biological dynamics using benchmark models from systems biology. We show that combinations involving as few as two or three terms can already exhibit strong multicollinearity and extremely large condition numbers. We further show that orthogonal polynomial bases do not consistently resolve ill-conditioning and can perform worse than monomial libraries when the data distribution deviates from the weight function associated with the orthogonal basis. Finally, we demonstrate that when data are sampled from distributions aligned with the appropriate weight functions corresponding to the orthogonal basis, numerical conditioning improves, and orthogonal polynomial bases can yield improved model recovery accuracy across two baseline models.
- Abstract(参考訳): データ駆動による時系列データによる支配方程式の発見は、複雑な生物学的システムを理解するための強力なフレームワークを提供する。
候補関数に対するスパース回帰を用いたライブラリベースのアプローチは、かなり有望であるが、候補関数が強く相関すると、数値的条件付け(英語版)という重要な課題に直面している。
厳密なサンプリングや制限されたサンプリングは、特定のライブラリの選択とともに、強い多重線型性と数値不安定性を生み出すことができる。
このような場合、測定ノイズは、真の基礎となる力学を隠蔽し、正確なシステム同定を妨げる、広範囲に異なる復元モデルをもたらす可能性がある。
スパース正則化は相似解を促進し、条件付け問題を部分的に緩和するが、強い相関関係は持続し、正則化は回復したモデルに偏りがあり、回帰問題はデータの小さな摂動に非常に敏感である。
本稿では, システム生物学のベンチマークモデルを用いて, 環境条件が生体動態のスパース同定に与える影響を系統解析する。
最大2、3項の組合せは、既に強い多重線型性および極端に大きな条件数を示すことができる。
さらに、直交多項式基底は不条件を常に解決せず、データ分布が直交基底に付随する重み関数から逸脱した場合、単項ライブラリよりも悪化することを示す。
最後に、直交基底に対応する適切な重み関数に整合した分布からデータをサンプリングすると、数値条件が改善し、直交多項式基底は2つのベースラインモデルでモデル回復精度が向上することを示した。
関連論文リスト
- Covariate-assisted Grade of Membership Models via Shared Latent Geometry [0.7939348535496568]
メンバーシップモデルのグレードは、個人レベルの混合メンバーシップスコアを通して多変量カテゴリデータを解析するための柔軟な潜在変数モデルである。
補助共変量体を組み込む従来のアプローチは、一般に完全に指定された関節の確率に依存しており、計算的に集中しており、誤特定に敏感である。
我々は,共変量支援型メンバシップモデルを導入し,共変量情報を統合する。
論文 参考訳(メタデータ) (2026-01-24T02:30:36Z) - Dendrograms of Mixing Measures for Softmax-Gated Gaussian Mixture of Experts: Consistency without Model Sweeps [41.371172458797524]
ゲーティングパラメータの共通翻訳、固有のゲート-エキスパート相互作用、およびタイトな数値-デノミネータ結合までの不特定性に対処する。
モデル選択には, 最適なパラメータ率を得る専門家の数を一貫したスイープフリーセレクタとして, デンドログラム誘導SGMoEを適応させる。
干ばつを識別できるトウモロコシの形質のデータセット上で、私たちのデンドログラム誘導SGMoEは2人の専門家を選別し、明確な混合階層を公開し、確率を早期に安定化し、解釈可能な遺伝子型フェノタイプマップを生成する。
論文 参考訳(メタデータ) (2025-10-14T17:23:44Z) - Robust Confinement State Classification with Uncertainty Quantification through Ensembled Data-Driven Methods [39.27649013012046]
本研究では,不確実性定量化とモデルロバスト性を考慮した閉じ込め状態分類法を開発した。
我々は,TV放電のオフライン解析に焦点をあて,Lモード,Hモード,および中間ディザリング位相(D)を区別する。
302TCV放電のデータセットは完全にラベル付けされ、一般公開される。
論文 参考訳(メタデータ) (2025-02-24T18:25:22Z) - Variational Hierarchical Mixtures for Probabilistic Learning of Inverse
Dynamics [20.953728061894044]
適切に校正された確率回帰モデルは、データセットが急速に成長し、タスクがより複雑になるにつれて、ロボットアプリケーションにおいて重要な学習要素である。
計算効率のよい表現と計算複雑性の正規化を両世界の利点と組み合わせた確率論的階層的モデリングパラダイムを考察する。
これらの表現を学習するための2つの効率的な変分推論手法を導出し、階層的無限局所回帰モデルの利点を強調する。
論文 参考訳(メタデータ) (2022-11-02T13:54:07Z) - Learning Multivariate CDFs and Copulas using Tensor Factorization [39.24470798045442]
データの多変量分布を学習することは、統計学と機械学習における中核的な課題である。
本研究では,多変量累積分布関数(CDF)を学習し,混合確率変数を扱えるようにすることを目的とする。
混合確率変数の合同CDFの任意のグリッドサンプリング版は、単純ベイズモデルとして普遍表現を許容することを示す。
提案モデルの性能を,回帰,サンプリング,データ計算を含むいくつかの合成および実データおよびアプリケーションで実証する。
論文 参考訳(メタデータ) (2022-10-13T16:18:46Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Dealing with collinearity in large-scale linear system identification
using Bayesian regularization [3.04585143845864]
出力が多くの相関入力の結果である可能性のある大規模線形系と安定系の同定を考察する。
我々は、任意のインパルス応答をゼロ平均ガウス過程の実現としてモデル化するベイズ正規化に基づく戦略を開発する。
次に、コリニアリティに対処し、インパルス応答の後方を効率的に再構築できる新しいマルコフ連鎖モンテカルロスキームを設計する。
論文 参考訳(メタデータ) (2022-03-25T13:11:26Z) - Capturing Actionable Dynamics with Structured Latent Ordinary
Differential Equations [68.62843292346813]
本稿では,その潜在表現内でのシステム入力の変動をキャプチャする構造付き潜在ODEモデルを提案する。
静的変数仕様に基づいて,本モデルではシステムへの入力毎の変動要因を学習し,潜在空間におけるシステム入力の影響を分離する。
論文 参考訳(メタデータ) (2022-02-25T20:00:56Z) - A non-asymptotic model selection in block-diagonal mixture of polynomial
experts models [1.491109220586182]
回帰モデルの未知条件密度を推定するために, ペナル化最大選択基準を導入する。
我々は、Jensen-Kullback-Leibler型損失によるペナル化極大確率で満たされる有限サンプルオラクルを含む強力な理論的保証を提供する。
論文 参考訳(メタデータ) (2021-04-18T21:32:20Z) - Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文 参考訳(メタデータ) (2020-08-01T10:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。