論文の概要: Bayesian Variable Selection in a Million Dimensions
- arxiv url: http://arxiv.org/abs/2208.01180v1
- Date: Tue, 2 Aug 2022 00:11:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:03:45.067483
- Title: Bayesian Variable Selection in a Million Dimensions
- Title(参考訳): 百万次元におけるベイズ変数の選択
- Authors: Martin Jankowiak
- Abstract要約: 提案手法では, 繰り返し毎のコストが P のサブ線形である効率的な MCMC スキームを導入する。
本稿では,このスキームを一般線形モデルに拡張してカウントデータに適用する方法について述べる。
実験では、癌やトウモロコシゲノムデータを含む方法の有効性を実証した。
- 参考スコア(独自算出の注目度): 7.366246663367533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bayesian variable selection is a powerful tool for data analysis, as it
offers a principled method for variable selection that accounts for prior
information and uncertainty. However, wider adoption of Bayesian variable
selection has been hampered by computational challenges, especially in
difficult regimes with a large number of covariates P or non-conjugate
likelihoods. To scale to the large P regime we introduce an efficient MCMC
scheme whose cost per iteration is sublinear in P. In addition we show how this
scheme can be extended to generalized linear models for count data, which are
prevalent in biology, ecology, economics, and beyond. In particular we design
efficient algorithms for variable selection in binomial and negative binomial
regression, which includes logistic regression as a special case. In
experiments we demonstrate the effectiveness of our methods, including on
cancer and maize genomic data.
- Abstract(参考訳): ベイズ変数選択は、事前情報と不確実性を考慮した変数選択の原則的方法を提供するため、データ解析の強力なツールである。
しかし、ベイズ変数の選択の広範な採用は計算上の困難、特に多くの共変量 p や非共役確率を持つ難しい状況によって妨げられている。
さらに,この手法が,生物学,生態学,経済学などの分野で広く普及しているカウントデータに対する一般化線形モデルにまで拡張可能であることを示す。
特に,二項回帰および負二項回帰における変数選択のための効率的なアルゴリズムを設計した。
実験では、癌やトウモロコシゲノムデータを含む方法の有効性を実証した。
関連論文リスト
- Variational empirical Bayes variable selection in high-dimensional logistic regression [2.4032899110671955]
我々は,その新しい,計算効率の良い変分近似を開発した。
そのようなノベルティの1つは、回帰係数自身ではなく、モデル空間上の辺分布に対してこの近似を直接発展させることである。
シミュレーションにおいて,本手法の強い性能を実証し,我々の変分近似が近似している後部分布で満たされる強い選択整合性を引き継ぐことを証明した。
論文 参考訳(メタデータ) (2025-02-14T19:57:13Z) - A Heavy-Tailed Algebra for Probabilistic Programming [53.32246823168763]
本稿では,確率変数の尾を解析するための体系的アプローチを提案する。
本稿では,確率型プログラミング言語コンパイラの静的解析(サンプル作成前)において,この手法をどのように利用できるかを示す。
実験結果から,重み付き代数を利用する推論アルゴリズムは,多数の密度モデリングおよび変分推論タスクにおいて優れた性能が得られることを確認した。
論文 参考訳(メタデータ) (2023-06-15T16:37:36Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Flexible variable selection in the presence of missing data [0.0]
本稿では,非パラメトリックな変数選択アルゴリズムと多重計算を組み合わせることで,非ランダムなデータが存在する場合のフレキシブルなパネルの開発を行う。
提案手法の動作特性は良好であり,より高い分類性能と可変選択性能を有するパネルが得られた。
論文 参考訳(メタデータ) (2022-02-25T21:41:03Z) - Variational Bayes for high-dimensional proportional hazards models with
applications to gene expression variable selection [3.8761064607384195]
本研究では,高次元生存データに対する予測と変動選択のための変分ベイズ比例ハザードモデルを提案する。
本手法は,平均場変動近似に基づいて,MCMCの高計算コストを克服する。
提案手法は,生存率を検閲した2つのトランスクリプトームデータセット上で,変数選択にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2021-12-19T22:10:41Z) - Fast Bayesian Variable Selection in Binomial and Negative Binomial
Regression [9.774282306558465]
本稿では,二項回帰および負二項回帰における変数選択のための効率的なMCMCスキームを導入し,ロジスティック回帰を特別な事例として活用する。
実験では、17万の共変量を持つデータを含む、我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-06-28T20:54:41Z) - Variable selection with missing data in both covariates and outcomes:
Imputation and machine learning [1.0333430439241666]
欠落したデータ問題は、健康研究で普遍的です。
機械学習はパラメトリックな仮定を弱める。
XGBoostとBARTは、さまざまな設定で最高のパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-04-06T20:18:29Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Probabilistic Circuits for Variational Inference in Discrete Graphical
Models [101.28528515775842]
変分法による離散的グラフィカルモデルの推論は困難である。
エビデンス・ロウアーバウンド(ELBO)を推定するためのサンプリングに基づく多くの手法が提案されている。
Sum Product Networks (SPN) のような確率的回路モデルのトラクタビリティを活用する新しい手法を提案する。
選択的SPNが表現的変動分布として適していることを示し、対象モデルの対数密度が重み付けされた場合、対応するELBOを解析的に計算可能であることを示す。
論文 参考訳(メタデータ) (2020-10-22T05:04:38Z) - Optimal Feature Manipulation Attacks Against Linear Regression [64.54500628124511]
本稿では,データセットに慎重に設計した有害なデータポイントを付加したり,元のデータポイントを修正したりすることで,線形回帰による係数の操作方法について検討する。
エネルギー予算を考慮し, 目標が指定された回帰係数を1つ変更する場合に, 最適毒素データ点の閉形式解をまず提示する。
次に、攻撃者が1つの特定の回帰係数を変更しつつ、他をできるだけ小さく変更することを目的とした、より困難なシナリオに分析を拡張します。
論文 参考訳(メタデータ) (2020-02-29T04:26:59Z) - Naive Feature Selection: a Nearly Tight Convex Relaxation for Sparse Naive Bayes [51.55826927508311]
そこで本稿では,特徴選択に使用可能なnaive Bayesのスパースバージョンを提案する。
余剰特徴の余剰寄与が減少するにつれて凸緩和境界が厳密になることを示す。
二項スパースモデルと多項スパースモデルの両方は、問題サイズにおいてほぼ線形な時間で解決可能である。
論文 参考訳(メタデータ) (2019-05-23T19:30:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。