論文の概要: Fast Bayesian Variable Selection in Binomial and Negative Binomial
Regression
- arxiv url: http://arxiv.org/abs/2106.14981v1
- Date: Mon, 28 Jun 2021 20:54:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-30 15:19:58.449156
- Title: Fast Bayesian Variable Selection in Binomial and Negative Binomial
Regression
- Title(参考訳): 二項および負二項回帰における高速ベイズ変数の選択
- Authors: Martin Jankowiak
- Abstract要約: 本稿では,二項回帰および負二項回帰における変数選択のための効率的なMCMCスキームを導入し,ロジスティック回帰を特別な事例として活用する。
実験では、17万の共変量を持つデータを含む、我々のアプローチの有効性を実証する。
- 参考スコア(独自算出の注目度): 9.774282306558465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bayesian variable selection is a powerful tool for data analysis, as it
offers a principled method for variable selection that accounts for prior
information and uncertainty. However, wider adoption of Bayesian variable
selection has been hampered by computational challenges, especially in
difficult regimes with a large number of covariates or non-conjugate
likelihoods. Generalized linear models for count data, which are prevalent in
biology, ecology, economics, and beyond, represent an important special case.
Here we introduce an efficient MCMC scheme for variable selection in binomial
and negative binomial regression that exploits Tempered Gibbs Sampling (Zanella
and Roberts, 2019) and that includes logistic regression as a special case. In
experiments we demonstrate the effectiveness of our approach, including on
cancer data with seventeen thousand covariates.
- Abstract(参考訳): ベイズ変数選択は、事前情報と不確実性を考慮した変数選択の原則的方法を提供するため、データ解析の強力なツールである。
しかしながら、ベイズ変数の選択を広く採用することは、計算上の課題、特に多くの共変量や非共役確率を持つ難しい状況によって妨げられている。
生物学、生態学、経済学などで広く使われているカウントデータに対する一般化線形モデルは、重要な特殊なケースである。
ここでは,二項および負の2項回帰における変数選択のための効率的なmcmcスキームを導入し,温帯ギブズサンプリング(zanella and roberts, 2019)を活用し,特別にロジスティック回帰を含む。
実験では、17万の共変量を持つ癌データを含む,我々のアプローチの有効性を実証した。
関連論文リスト
- Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Variable selection for nonlinear Cox regression model via deep learning [0.0]
最近開発された深層学習に基づく変数選択モデルLassoNetを生存データに拡張する。
提案手法を適用し,びまん性大細胞型B細胞リンパ腫の実際のデータセットを解析した。
論文 参考訳(メタデータ) (2022-11-17T01:17:54Z) - Bayesian Variable Selection in a Million Dimensions [7.366246663367533]
提案手法では, 繰り返し毎のコストが P のサブ線形である効率的な MCMC スキームを導入する。
本稿では,このスキームを一般線形モデルに拡張してカウントデータに適用する方法について述べる。
実験では、癌やトウモロコシゲノムデータを含む方法の有効性を実証した。
論文 参考訳(メタデータ) (2022-08-02T00:11:15Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Flexible variable selection in the presence of missing data [0.0]
本稿では,非パラメトリックな変数選択アルゴリズムと多重計算を組み合わせることで,非ランダムなデータが存在する場合のフレキシブルなパネルの開発を行う。
提案手法の動作特性は良好であり,より高い分類性能と可変選択性能を有するパネルが得られた。
論文 参考訳(メタデータ) (2022-02-25T21:41:03Z) - Machine Learning for Multi-Output Regression: When should a holistic
multivariate approach be preferred over separate univariate ones? [62.997667081978825]
ランダムフォレストのような木に基づくアンサンブルは、統計学の手法の中で近代的な古典である。
これらの手法を広範囲なシミュレーションで比較し,多変量アンサンブル技術を用いた場合の主問題に答える。
論文 参考訳(メタデータ) (2022-01-14T08:44:25Z) - Variational Bayes for high-dimensional proportional hazards models with
applications to gene expression variable selection [3.8761064607384195]
本研究では,高次元生存データに対する予測と変動選択のための変分ベイズ比例ハザードモデルを提案する。
本手法は,平均場変動近似に基づいて,MCMCの高計算コストを克服する。
提案手法は,生存率を検閲した2つのトランスクリプトームデータセット上で,変数選択にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2021-12-19T22:10:41Z) - Variable selection with missing data in both covariates and outcomes:
Imputation and machine learning [1.0333430439241666]
欠落したデータ問題は、健康研究で普遍的です。
機械学習はパラメトリックな仮定を弱める。
XGBoostとBARTは、さまざまな設定で最高のパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-04-06T20:18:29Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文 参考訳(メタデータ) (2020-08-01T10:36:27Z) - Optimal Feature Manipulation Attacks Against Linear Regression [64.54500628124511]
本稿では,データセットに慎重に設計した有害なデータポイントを付加したり,元のデータポイントを修正したりすることで,線形回帰による係数の操作方法について検討する。
エネルギー予算を考慮し, 目標が指定された回帰係数を1つ変更する場合に, 最適毒素データ点の閉形式解をまず提示する。
次に、攻撃者が1つの特定の回帰係数を変更しつつ、他をできるだけ小さく変更することを目的とした、より困難なシナリオに分析を拡張します。
論文 参考訳(メタデータ) (2020-02-29T04:26:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。