論文の概要: Measurement noise limits the advantage of nonlinear models over linear models in biomedical prediction
- arxiv url: http://arxiv.org/abs/2606.18420v1
- Date: Tue, 16 Jun 2026 19:15:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.861242
- Title: Measurement noise limits the advantage of nonlinear models over linear models in biomedical prediction
- Title(参考訳): 生体医学的予測における非線形モデルの非線形モデルに対する利点を計測ノイズが制限する
- Authors: Marc-Andre Schulz, Kerstin Ritter,
- Abstract要約: 生体医学データでは、フレキシブルモデルが線形回帰とロジスティック回帰によって繰り返し一致または打ち負かされる。
これらの修正は、バインディング制限がモデルではなく測定値である場合に役に立ちません。
140の英国バイオバンクタスクで、フレキシブルモデルとリニアモデルの間には、予測されたノイズシグネチャがある。
- 参考スコア(独自算出の注目度): 0.3093890460224435
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: On biomedical tabular data, flexible models such as deep networks, gradient-boosted trees, and kernel methods are repeatedly matched or beaten by linear and logistic regression given the same features. The usual reaction is to treat this as a model-side shortfall, to be fixed with more data, a better architecture, or tuning, on the assumption that the nonlinear structure is there and the model has failed to capture it. We argue that these fixes cannot help when the binding limit is the measurement rather than the model, as it frequently is in biomedicine. Additive noise blurs the population-optimal predictor, and because blurring removes a function's fine, rapidly varying detail before its broad shape, it erases nonlinear structure faster than linear structure. A degree-$k$ interaction is attenuated by the $k$-th power of feature reliability, while the linear part is attenuated only once. At the reliabilities typical of biomedical measurement, the nonlinear advantage can vanish even when the underlying biology is strongly nonlinear, and what the noise removes cannot be recovered by a larger cohort or a more flexible model, only by better measurement. The nonlinearity is hidden, not absent, and a tie between linear and flexible models is not by itself a verdict on the biology. These pieces are classical, drawn from measurement-error statistics, psychometrics, and Gaussian analysis, and we assemble them into an exact excess-risk identity. Measurement reliability is one of three conditions, alongside sample size and feature representation, that must align for a flexible model to help, and together they leave only a narrow window that most biomedical tasks fall outside. Across 140 UK Biobank tasks, the gap between flexible and linear models, where it exists, carries the predicted noise signature, and the three conditions can be separated by intervention but not by a benchmark alone.
- Abstract(参考訳): 生体図表データでは, 深層ネットワーク, 勾配木, カーネルメソッドなどの柔軟なモデルが, 同じ特徴から線形回帰やロジスティック回帰によって繰り返し一致するか, 打ち負かされる。
通常の反応は、これをモデル側の欠点として扱い、より多くのデータで固定され、より優れたアーキテクチャやチューニングが、非線形構造が存在し、モデルがそれをキャプチャできなかったという仮定に基づいて行われる。
これらの修正は、しばしば生体医学において、結合限界がモデルではなく測定値である場合に役に立たないと論じる。
付加雑音は集団最適予測器を曖昧にし、ぼかしによって関数の細かな細部が広くなる前に急速に変化するため、線形構造よりも高速に非線形構造を消去する。
次数-$k$相互作用は、機能信頼性の$k$-第3のパワーによって減衰されるが、線形部分は1度だけ減衰される。
バイオメディカル測定の典型的な信頼性において、基礎となる生物学が強く非線形である場合でも非線形の利点は消え、より大きなコホートやより柔軟なモデルによって除去されるノイズは、より良い測定によってのみ回収できない。
非線形性は隠され、欠落せず、線形モデルとフレキシブルモデルの間の結びつきは、それ自体生物学の判断ではない。
これらの楽曲は古典的であり、測定エラー統計、サイコメトリック、ガウス分析から抽出され、我々はそれらを正確に過度なリスクのアイデンティティに組み立てる。
測定信頼性は、サンプルサイズと特徴表現の3つの条件のうちの1つであり、柔軟性のあるモデルが役に立つように調整する必要がある。
140の英国バイオバンクタスク全体では、フレキシブルモデルと線形モデルの間のギャップは予測されたノイズシグネチャを持ち、これら3つの条件は介入によって分離できるが、ベンチマークだけでは分離できない。
関連論文リスト
- Inference of Qualitative Models from Steady-State Data via Weighted MaxSMT [0.7340017786387767]
We introduced a robust inference method based on weighted MaxSMT。
我々のアプローチは、事前知識ネットワークから神経細胞の分化モデルを予測するのに有効であることを示す。
論文 参考訳(メタデータ) (2026-05-08T08:34:50Z) - Ill-Conditioning in Dictionary-Based Dynamic-Equation Learning: A Systems Biology Case Study [2.1795865731681903]
システム生物学のベンチマークモデルを用いて, 条件が生体動態の同定にどう影響するかを示す。
スパースベースは不調な条件を常に解決せず,単項ライブラリよりも性能が劣ることを示す。
論文 参考訳(メタデータ) (2026-03-11T21:42:02Z) - A solvable high-dimensional model where nonlinear autoencoders learn structure invisible to PCA while test loss misaligns with generalization [12.791897914144378]
本稿では,2つの潜在因子を持つトラクタブルな高次元スパイクモデルを提案する。
PCAと線形オートエンコーダは後者の回復に失敗し、最小の非線形オートエンコーダは両方を確実に抽出する。
私たちのモデルは、自己監督型テストの損失が表現品質と不整合である、抽出可能な例も提供します。
論文 参考訳(メタデータ) (2026-02-11T09:31:29Z) - Linearized Optimal Transport for Analysis of High-Dimensional Point-Cloud and Single-Cell Data [45.87606039212519]
シングルセル技術は、細胞の高次元点雲を生成する。
各患者は単純なベクトルではなく不規則な点雲で表される。
線形最適輸送フレームワークを用いて不規則点雲を固定次元ユークリッド空間に埋め込む。
論文 参考訳(メタデータ) (2025-10-24T21:33:12Z) - Uncovering the Functional Roles of Nonlinearity in Memory [2.315156126698557]
我々は、繰り返しネットワークにおける非線形性の機能的役割を系統的に解明するために、性能比較を超えていく。
ニアリニアリカレントニューラルネットワーク(AL-RNN)を用いて非線形性に対するきめ細かい制御を可能にする。
最小の非線形性は十分であるだけでなく、しばしば最適であり、より単純で、より堅牢で、完全に非線形あるいは線形なモデルよりも解釈可能なモデルが得られる。
論文 参考訳(メタデータ) (2025-06-09T16:32:19Z) - Hypothesis-free discovery from epidemiological data by automatic detection and local inference for tree-based nonlinearities and interactions [0.0]
RuleSHAPはルールベースの仮説のない発見のためのフレームワークである。
シミュレーションデータにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2025-05-01T14:55:22Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Hessian Eigenspectra of More Realistic Nonlinear Models [73.31363313577941]
私たちは、非線形モデルの広いファミリーのためのヘッセン固有スペクトルの言語的特徴付けを行います。
我々の分析は、より複雑な機械学習モデルで観察される多くの顕著な特徴の起源を特定するために一歩前進する。
論文 参考訳(メタデータ) (2021-03-02T06:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。