論文の概要: Subset selection for linear mixed models
- arxiv url: http://arxiv.org/abs/2107.12890v1
- Date: Tue, 27 Jul 2021 15:47:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 18:34:19.215868
- Title: Subset selection for linear mixed models
- Title(参考訳): 線形混合モデルの部分集合選択
- Authors: Daniel R. Kowal
- Abstract要約: 線形混合モデル(LMM)は、構造的依存を伴う回帰解析に有効である。
LMMを用いた部分集合選択のためのベイズ決定解析を導入する。
これらのツールは、シミュレーションデータと縦方向の身体活動データセットに適用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Linear mixed models (LMMs) are instrumental for regression analysis with
structured dependence, such as grouped, clustered, or multilevel data. However,
selection among the covariates--while accounting for this structured
dependence--remains a challenge. We introduce a Bayesian decision analysis for
subset selection with LMMs. Using a Mahalanobis loss function that incorporates
the structured dependence, we derive optimal linear actions for any subset of
covariates and under any Bayesian LMM. Crucially, these actions inherit
shrinkage or regularization and uncertainty quantification from the underlying
Bayesian LMM. Rather than selecting a single "best" subset, which is often
unstable and limited in its information content, we collect the acceptable
family of subsets that nearly match the predictive ability of the "best"
subset. The acceptable family is summarized by its smallest member and key
variable importance metrics. Customized subset search and out-of-sample
approximation algorithms are provided for more scalable computing. These tools
are applied to simulated data and a longitudinal physical activity dataset, and
in both cases demonstrate excellent prediction, estimation, and selection
ability.
- Abstract(参考訳): 線形混合モデル(LMM)は、グループ化、クラスタ化、マルチレベルデータなどの構造的依存を伴う回帰分析のための道具である。
しかし、この構造的依存を考慮に入れながら、共変量の選択は課題である。
LMMを用いた部分集合選択のためのベイズ決定解析を導入する。
構造的依存を組み込んだマハラノビス損失関数を用いて、共変量の任意の部分集合と任意のベイズ LMM の下での最適線型作用を導出する。
重要なことに、これらの作用は基底となるベイズ LMM から縮退または正則化と不確実性定量化を継承する。
しばしば不安定で情報内容に制限のある単一の"ベスト"サブセットを選択するのではなく、"ベスト"サブセットの予測能力にほぼ匹敵する、許容可能なサブセットファミリを収集します。
許容されるファミリーは、最小のメンバとキー変数の重要度によって要約される。
よりスケーラブルな計算のために、カスタマイズされたサブセット検索とサンプル外近似アルゴリズムが提供される。
これらのツールはシミュレーションデータおよび縦型物理活動データセットに適用され、どちらも優れた予測、推定、選択能力を示す。
関連論文リスト
- Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - A Consistent and Scalable Algorithm for Best Subset Selection in Single
Index Models [1.3236116985407258]
高次元モデルにおける最良の部分集合選択は、計算的に難解であることが知られている。
我々は,高次元SIMにおける最良部分選択のための,証明可能な最初の拡張性アルゴリズムを提案する。
アルゴリズムは部分集合選択の一貫性を保ち、高い確率でオラクル特性を持つ。
論文 参考訳(メタデータ) (2023-09-12T13:48:06Z) - Feature Selection via the Intervened Interpolative Decomposition and its
Application in Diversifying Quantitative Strategies [4.913248451323163]
本稿では,観測行列の各列がそれぞれの優先度や重要性を持つ補間分解(ID)を計算するための確率論的モデルを提案する。
提案したモデルを,中国A株10株を含む実世界のデータセット上で評価した。
論文 参考訳(メタデータ) (2022-09-29T03:36:56Z) - Efficient and Near-Optimal Smoothed Online Learning for Generalized
Linear Functions [28.30744223973527]
我々は,K-wise線形分類において,統計学的に最適なログ(T/sigma)の後悔を初めて楽しむ計算効率のよいアルゴリズムを提案する。
一般化線形分類器によって誘導される不一致領域の幾何学の新たな特徴付けを開発する。
論文 参考訳(メタデータ) (2022-05-25T21:31:36Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Joint Adaptive Graph and Structured Sparsity Regularization for
Unsupervised Feature Selection [6.41804410246642]
本稿では,共同適応グラフと構造付き空間正規化unsupervised feature selection (JASFS)法を提案する。
最適な機能のサブセットがグループで選択され、選択された機能の数が自動的に決定される。
8つのベンチマーク実験の結果,提案手法の有効性と有効性を示した。
論文 参考訳(メタデータ) (2020-10-09T08:17:04Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - Slice Sampling for General Completely Random Measures [74.24975039689893]
本稿では, 後続推定のためのマルコフ連鎖モンテカルロアルゴリズムについて, 補助スライス変数を用いてトランケーションレベルを適応的に設定する。
提案アルゴリズムの有効性は、いくつかの一般的な非パラメトリックモデルで評価される。
論文 参考訳(メタデータ) (2020-06-24T17:53:53Z) - Robust Grouped Variable Selection Using Distributionally Robust
Optimization [11.383869751239166]
摂動下での群付き変数選択のための不確実性セットを用いた分布ロバスト最適化(DRO)の定式化を提案する。
我々は,サンプル外損失と推定バイアスの確率的境界を証明し,推定器の群化効果を確立する。
我々の定式化は,群レベルでの空間性を促進する解釈可能で同相なモデルを生成することを示す。
論文 参考訳(メタデータ) (2020-06-10T22:32:52Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。