論文の概要: Modelling High-Dimensional Categorical Data Using Nonconvex Fusion
Penalties
- arxiv url: http://arxiv.org/abs/2002.12606v5
- Date: Fri, 17 Dec 2021 21:31:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 02:50:05.875092
- Title: Modelling High-Dimensional Categorical Data Using Nonconvex Fusion
Penalties
- Title(参考訳): 非凸核融合ペナルティを用いた高次元分類データのモデル化
- Authors: Benjamin G. Stokell, Rajen D. Shah, Ryan J. Tibshirani
- Abstract要約: SCOPEと呼ばれる我々の推定器は、対応する係数を正確に等しくすることで、レベルを融合する。
変数の非次元ブロック内での正確かつ効率的なクラスタリングのためのアルゴリズムを提供する。
- 参考スコア(独自算出の注目度): 7.262048441360131
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a method for estimation in high-dimensional linear models with
nominal categorical data. Our estimator, called SCOPE, fuses levels together by
making their corresponding coefficients exactly equal. This is achieved using
the minimax concave penalty on differences between the order statistics of the
coefficients for a categorical variable, thereby clustering the coefficients.
We provide an algorithm for exact and efficient computation of the global
minimum of the resulting nonconvex objective in the case with a single variable
with potentially many levels, and use this within a block coordinate descent
procedure in the multivariate case. We show that an oracle least squares
solution that exploits the unknown level fusions is a limit point of the
coordinate descent with high probability, provided the true levels have a
certain minimum separation; these conditions are known to be minimal in the
univariate case. We demonstrate the favourable performance of SCOPE across a
range of real and simulated datasets. An R package CatReg implementing SCOPE
for linear models and also a version for logistic regression is available on
CRAN.
- Abstract(参考訳): 名目分類データを用いた高次元線形モデルにおける推定手法を提案する。
我々の推定器はSCOPEと呼ばれ、対応する係数を正確に等しくすることでレベルを融合する。
これは、カテゴリー変数の係数の次数統計の差に関するminimax concave penaltyを用いて達成され、係数をクラスタリングする。
本手法は,多変量体の場合のブロック座標降下手順において,多変量体の場合の非凸目標の大域最小値の高精度かつ効率的な計算を行うアルゴリズムである。
未知の準位融合を利用するオラクル最小二乗解が、真の準位が一定の最小の分離を持つならば、高い確率で座標降下の極限点であることを示し、これらの条件は単変量の場合最小であることが知られている。
本研究では,実データとシミュレーションデータの両方において,スコープの好適な性能を示す。
線形モデル用にSCOPEを実装したRパッケージCatRegと、ロジスティック回帰のためのバージョンがCRANで利用可能である。
関連論文リスト
- Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Branch and Bound to Assess Stability of Regression Coefficients in Uncertain Models [0.6990493129893112]
提案アルゴリズムは,数学的な結果のサポート,サンプルアプリケーション,コンピュータコードへのリンクなどとともに導入する。
これは、研究者が高次元データを要約し、不確実なモデルにおける回帰係数の安定性を評価するのに役立つ。
論文 参考訳(メタデータ) (2024-08-19T01:37:14Z) - Statistical Limits of Adaptive Linear Models: Low-Dimensional Estimation
and Inference [5.924780594614676]
データの任意適応が許された場合、単一の座標を推定する誤差を$sqrtd$の倍にすることができる。
2段階適応線形推定方程式(TALE)を解くことにより,単一座標推定のための新しい推定器を提案する。
論文 参考訳(メタデータ) (2023-10-01T00:45:09Z) - AdaCat: Adaptive Categorical Discretization for Autoregressive Models [84.85102013917606]
AdaCat(Adaptive Categorical Discretization)と呼ばれる,効率的で表現性の高いマルチモーダルパラメータ化を提案する。
AdaCatは自己回帰モデルの各次元を適応的に識別し、モデルが関心の細かい間隔に密度を割り当てることを可能にする。
論文 参考訳(メタデータ) (2022-08-03T17:53:46Z) - Faster One-Sample Stochastic Conditional Gradient Method for Composite
Convex Minimization [61.26619639722804]
滑らかで非滑らかな項の和として形成される凸有限サム目標を最小化するための条件勾配法(CGM)を提案する。
提案手法は, 平均勾配 (SAG) 推定器を備え, 1回に1回のサンプルしか必要としないが, より高度な分散低減技術と同等の高速収束速度を保証できる。
論文 参考訳(メタデータ) (2022-02-26T19:10:48Z) - Piecewise linear regression and classification [0.20305676256390928]
本稿では,線形予測器を用いた多変量回帰と分類問題の解法を提案する。
本論文で記述されたアルゴリズムのpython実装は、http://cse.lab.imtlucca.it/bemporad/parcで利用可能である。
論文 参考訳(メタデータ) (2021-03-10T17:07:57Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z) - Multiclass classification by sparse multinomial logistic regression [10.312968200748116]
スパース多項ロジスティック回帰による高次元多クラス分類を考察する。
本稿では,複雑性ペナルティを伴うペナル化最大度に基づく特徴選択手法を提案する。
我々は,小クラスと多数のクラスに対応する2つのレギュレーションが存在することを示した。
論文 参考訳(メタデータ) (2020-03-04T08:44:48Z) - Adaptive Correlated Monte Carlo for Contextual Categorical Sequence
Generation [77.7420231319632]
我々は,モンテカルロ (MC) ロールアウトの集合を分散制御のために評価する政策勾配推定器に,カテゴリー列の文脈的生成を適用する。
また,二分木ソフトマックスモデルに相関したMCロールアウトを用いることで,大語彙シナリオにおける高生成コストを低減できることを示す。
論文 参考訳(メタデータ) (2019-12-31T03:01:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。