論文の概要: Bayesian Variable Selection in a Million Dimensions
- arxiv url: http://arxiv.org/abs/2208.01180v1
- Date: Tue, 2 Aug 2022 00:11:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:03:45.067483
- Title: Bayesian Variable Selection in a Million Dimensions
- Title(参考訳): 百万次元におけるベイズ変数の選択
- Authors: Martin Jankowiak
- Abstract要約: 提案手法では, 繰り返し毎のコストが P のサブ線形である効率的な MCMC スキームを導入する。
本稿では,このスキームを一般線形モデルに拡張してカウントデータに適用する方法について述べる。
実験では、癌やトウモロコシゲノムデータを含む方法の有効性を実証した。
- 参考スコア(独自算出の注目度): 7.366246663367533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bayesian variable selection is a powerful tool for data analysis, as it
offers a principled method for variable selection that accounts for prior
information and uncertainty. However, wider adoption of Bayesian variable
selection has been hampered by computational challenges, especially in
difficult regimes with a large number of covariates P or non-conjugate
likelihoods. To scale to the large P regime we introduce an efficient MCMC
scheme whose cost per iteration is sublinear in P. In addition we show how this
scheme can be extended to generalized linear models for count data, which are
prevalent in biology, ecology, economics, and beyond. In particular we design
efficient algorithms for variable selection in binomial and negative binomial
regression, which includes logistic regression as a special case. In
experiments we demonstrate the effectiveness of our methods, including on
cancer and maize genomic data.
- Abstract(参考訳): ベイズ変数選択は、事前情報と不確実性を考慮した変数選択の原則的方法を提供するため、データ解析の強力なツールである。
しかし、ベイズ変数の選択の広範な採用は計算上の困難、特に多くの共変量 p や非共役確率を持つ難しい状況によって妨げられている。
さらに,この手法が,生物学,生態学,経済学などの分野で広く普及しているカウントデータに対する一般化線形モデルにまで拡張可能であることを示す。
特に,二項回帰および負二項回帰における変数選択のための効率的なアルゴリズムを設計した。
実験では、癌やトウモロコシゲノムデータを含む方法の有効性を実証した。
関連論文リスト
- Scaling and renormalization in high-dimensional regression [72.59731158970894]
本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。
本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文 参考訳(メタデータ) (2024-05-01T15:59:00Z) - A Heavy-Tailed Algebra for Probabilistic Programming [53.32246823168763]
本稿では,確率変数の尾を解析するための体系的アプローチを提案する。
本稿では,確率型プログラミング言語コンパイラの静的解析(サンプル作成前)において,この手法をどのように利用できるかを示す。
実験結果から,重み付き代数を利用する推論アルゴリズムは,多数の密度モデリングおよび変分推論タスクにおいて優れた性能が得られることを確認した。
論文 参考訳(メタデータ) (2023-06-15T16:37:36Z) - A model-free feature selection technique of feature screening and random
forest based recursive feature elimination [0.0]
質量特徴を持つ超高次元データのモデルフリー特徴選択法を提案する。
提案手法は選択整合性を示し, 弱正則条件下では$L$整合性を示す。
論文 参考訳(メタデータ) (2023-02-15T03:39:16Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Flexible variable selection in the presence of missing data [0.0]
本稿では,非パラメトリックな変数選択アルゴリズムと多重計算を組み合わせることで,非ランダムなデータが存在する場合のフレキシブルなパネルの開発を行う。
提案手法の動作特性は良好であり,より高い分類性能と可変選択性能を有するパネルが得られた。
論文 参考訳(メタデータ) (2022-02-25T21:41:03Z) - Variational Bayes for high-dimensional proportional hazards models with
applications to gene expression variable selection [3.8761064607384195]
本研究では,高次元生存データに対する予測と変動選択のための変分ベイズ比例ハザードモデルを提案する。
本手法は,平均場変動近似に基づいて,MCMCの高計算コストを克服する。
提案手法は,生存率を検閲した2つのトランスクリプトームデータセット上で,変数選択にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2021-12-19T22:10:41Z) - Fast Bayesian Variable Selection in Binomial and Negative Binomial
Regression [9.774282306558465]
本稿では,二項回帰および負二項回帰における変数選択のための効率的なMCMCスキームを導入し,ロジスティック回帰を特別な事例として活用する。
実験では、17万の共変量を持つデータを含む、我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-06-28T20:54:41Z) - Variable selection with missing data in both covariates and outcomes:
Imputation and machine learning [1.0333430439241666]
欠落したデータ問題は、健康研究で普遍的です。
機械学習はパラメトリックな仮定を弱める。
XGBoostとBARTは、さまざまな設定で最高のパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-04-06T20:18:29Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Probabilistic Circuits for Variational Inference in Discrete Graphical
Models [101.28528515775842]
変分法による離散的グラフィカルモデルの推論は困難である。
エビデンス・ロウアーバウンド(ELBO)を推定するためのサンプリングに基づく多くの手法が提案されている。
Sum Product Networks (SPN) のような確率的回路モデルのトラクタビリティを活用する新しい手法を提案する。
選択的SPNが表現的変動分布として適していることを示し、対象モデルの対数密度が重み付けされた場合、対応するELBOを解析的に計算可能であることを示す。
論文 参考訳(メタデータ) (2020-10-22T05:04:38Z) - Optimal Feature Manipulation Attacks Against Linear Regression [64.54500628124511]
本稿では,データセットに慎重に設計した有害なデータポイントを付加したり,元のデータポイントを修正したりすることで,線形回帰による係数の操作方法について検討する。
エネルギー予算を考慮し, 目標が指定された回帰係数を1つ変更する場合に, 最適毒素データ点の閉形式解をまず提示する。
次に、攻撃者が1つの特定の回帰係数を変更しつつ、他をできるだけ小さく変更することを目的とした、より困難なシナリオに分析を拡張します。
論文 参考訳(メタデータ) (2020-02-29T04:26:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。