論文の概要: Restricted maximum-likelihood method for learning latent variance
components in gene expression data with known and unknown confounders
- arxiv url: http://arxiv.org/abs/2005.02921v3
- Date: Thu, 4 Nov 2021 20:41:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 05:23:33.619038
- Title: Restricted maximum-likelihood method for learning latent variance
components in gene expression data with known and unknown confounders
- Title(参考訳): 未知の共同設立者による遺伝子発現データにおける潜時変化成分の学習のための制限付き最大様相法
- Authors: Muhammad Ammar Malik and Tom Michoel
- Abstract要約: いくつかの共起因子が知られているアプリケーションでは、既知の分散成分と潜伏成分の寄与を同時に推定することが課題である。
ここでは、最大形潜在変数が既知の共役因子に常に選択できることを解析的に証明する。
制限された部分空間上の確率を最大化することにより、潜在変数を推定する制限された最大様相法を提案する。
- 参考スコア(独自算出の注目度): 3.0458514384586395
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Random effect models are popular statistical models for detecting and
correcting spurious sample correlations due to hidden confounders in
genome-wide gene expression data. In applications where some confounding
factors are known, estimating simultaneously the contribution of known and
latent variance components in random effect models is a challenge that has so
far relied on numerical gradient-based optimizers to maximize the likelihood
function. This is unsatisfactory because the resulting solution is poorly
characterized and the efficiency of the method may be suboptimal. Here we prove
analytically that maximum-likelihood latent variables can always be chosen
orthogonal to the known confounding factors, in other words, that
maximum-likelihood latent variables explain sample covariances not already
explained by known factors. Based on this result we propose a restricted
maximum-likelihood method which estimates the latent variables by maximizing
the likelihood on the restricted subspace orthogonal to the known confounding
factors, and show that this reduces to probabilistic PCA on that subspace. The
method then estimates the variance-covariance parameters by maximizing the
remaining terms in the likelihood function given the latent variables, using a
newly derived analytic solution for this problem. Compared to gradient-based
optimizers, our method attains greater or equal likelihood values, can be
computed using standard matrix operations, results in latent factors that don't
overlap with any known factors, and has a runtime reduced by several orders of
magnitude. Hence the restricted maximum-likelihood method facilitates the
application of random effect modelling strategies for learning latent variance
components to much larger gene expression datasets than possible with current
methods.
- Abstract(参考訳): ランダム効果モデル(英: Random effect model)は、ゲノムワイドな遺伝子発現データにおいて、隠れた共同設立者による急激なサンプル相関の検出と修正のための一般的な統計モデルである。
いくつかの共起因子が知られているアプリケーションでは、ランダム効果モデルにおける既知のおよび潜時分散成分の寄与を同時に推定することは、確率関数を最大化するために数値勾配に基づく最適化器に依存してきた課題である。
これは、結果の解が不十分で、手法の効率が最適以下である可能性があるため不満足である。
ここでは、最大様潜時変数が既知の共起因子に対して直交的に常に選択できることを解析的に証明し、言い換えれば、最大様潜時変数が既知の因子によって説明されていないサンプル共分散を説明する。
この結果に基づき,既知の共役因子に直交する制限部分空間の確率を最大化することにより潜在変数を推定する制限最大化手法を提案し,その部分空間上の確率的pcaに還元することを示す。
この方法は、この問題に対する新しく導出された解析解を用いて、潜在変数が与えられた帰納関数の残りの項を最大化することで分散共分散パラメータを推定する。
勾配に基づくオプティマイザと比較すると、この手法は最大または同等の確率値を達成し、標準行列演算を用いて計算でき、既知の因子と重複しない潜在因子が生成され、ランタイムは数桁小さくなる。
したがって、制限された最大同化法は、現在の方法よりもずっと大きな遺伝子発現データセットに潜在分散成分を学習するためのランダム効果モデリング戦略の適用を容易にする。
関連論文リスト
- Selective Inference for Time-Varying Effect Moderation [3.8233569758620063]
因果効果のモデレーションは、個人が観察した特性に基づいて、結果変数に対する介入(または治療)の効果がどのように変化するかを調べる。
高次元解析は、しばしば解釈可能性に欠け、重要なモデレーターはノイズに隠れている。
時間変化による因果効果のモデレーションを選択的に推定する2段階の手法を提案する。
論文 参考訳(メタデータ) (2024-11-24T16:37:48Z) - A convex formulation of covariate-adjusted Gaussian graphical models via natural parametrization [6.353176264090468]
共発現量軌跡(eQTL)研究では、遺伝子の平均発現レベルと条件独立構造の両方が、それらの遺伝子に局所的な変異によって調節される可能性がある。
共調整GGMを推定する既存の方法は、平均が共変量に依存するか、平均と精度の行列を同時に推定する固有の非賢さのため、スケーリングの仮定に苦しむことしか許さない。
論文 参考訳(メタデータ) (2024-10-08T20:02:10Z) - Causal Discovery of Linear Non-Gaussian Causal Models with Unobserved Confounding [1.6932009464531739]
我々は,線形非ガウス構造方程式モデルについて考察する。
この設定では、因果構造は特定可能であるが、一般に、特定の因果効果を識別することはできない。
論文 参考訳(メタデータ) (2024-08-09T07:24:12Z) - Scaling and renormalization in high-dimensional regression [72.59731158970894]
本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。
本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文 参考訳(メタデータ) (2024-05-01T15:59:00Z) - Convergence of uncertainty estimates in Ensemble and Bayesian sparse
model discovery [4.446017969073817]
ブートストラップに基づく逐次しきい値最小二乗推定器による雑音に対する精度と頑健性の観点から経験的成功を示す。
このブートストラップに基づくアンサンブル手法は,誤差率の指数収束率で,確率的に正しい可変選択を行うことができることを示す。
論文 参考訳(メタデータ) (2023-01-30T04:07:59Z) - Data-Driven Influence Functions for Optimization-Based Causal Inference [105.5385525290466]
統計的汎関数に対するガトー微分を有限差分法で近似する構成的アルゴリズムについて検討する。
本研究では,確率分布を事前知識がないが,データから推定する必要がある場合について検討する。
論文 参考訳(メタデータ) (2022-08-29T16:16:22Z) - Posterior and Computational Uncertainty in Gaussian Processes [52.26904059556759]
ガウスのプロセスはデータセットのサイズとともに違法にスケールする。
多くの近似法が開発されており、必然的に近似誤差を導入している。
この余分な不確実性の原因は、計算が限られているため、近似後部を使用すると完全に無視される。
本研究では,観測された有限個のデータと有限個の計算量の両方から生じる組合せ不確実性を一貫した推定を行う手法の開発を行う。
論文 参考訳(メタデータ) (2022-05-30T22:16:25Z) - Variance Minimization in the Wasserstein Space for Invariant Causal
Prediction [72.13445677280792]
そこで本研究では,ICPで行ったアプローチを,予測器数で線形にスケールする一連の非パラメトリックテストとして再検討する。
これらのテストはそれぞれ、最適輸送理論の道具から導かれる新しい損失関数の最小化に依存している。
我々は,本手法が同定可能な直接原因の集合を回復できるという軽微な仮定の下で証明し,他のベンチマーク因果探索アルゴリズムと競合することを示す。
論文 参考訳(メタデータ) (2021-10-13T22:30:47Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z) - Supervised Autoencoders Learn Robust Joint Factor Models of Neural
Activity [2.8402080392117752]
神経科学の応用は、行動結果とともに異なる領域の脳活動に対応する高次元予測因子を収集する。
予測因子と結果の結合因子モデルは自然であるが、これらのモデルの最大推定値は、モデルが不特定である場合に実際に苦労することがある。
本稿では,教師付きオートエンコーダに基づく代替推論手法を提案する。潜在因子に確率分布を配置するのではなく,高次元予測器の未知関数として定義する。
論文 参考訳(メタデータ) (2020-04-10T19:31:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。