論文の概要: Mining the Factor Zoo: Estimation of Latent Factor Models with
Sufficient Proxies
- arxiv url: http://arxiv.org/abs/2212.12845v1
- Date: Sun, 25 Dec 2022 03:10:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 15:36:46.079683
- Title: Mining the Factor Zoo: Estimation of Latent Factor Models with
Sufficient Proxies
- Title(参考訳): 因子動物園の採掘:十分なプロキシを持つ潜在因子モデルの推定
- Authors: Runzhe Wan, Yingying Li, Wenbin Lu and Rui Song
- Abstract要約: 我々は2つのアプローチを潜在因子モデル推定にブリッジすることを提案する。
我々は、潜在因子モデルの推定を堅牢で、柔軟で、統計的により正確にする。
ボーナスとして、要素数の増加も認められている。
- 参考スコア(独自算出の注目度): 29.737081616352913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Latent factor model estimation typically relies on either using domain
knowledge to manually pick several observed covariates as factor proxies, or
purely conducting multivariate analysis such as principal component analysis.
However, the former approach may suffer from the bias while the latter can not
incorporate additional information. We propose to bridge these two approaches
while allowing the number of factor proxies to diverge, and hence make the
latent factor model estimation robust, flexible, and statistically more
accurate. As a bonus, the number of factors is also allowed to grow. At the
heart of our method is a penalized reduced rank regression to combine
information. To further deal with heavy-tailed data, a computationally
attractive penalized robust reduced rank regression method is proposed. We
establish faster rates of convergence compared with the benchmark. Extensive
simulations and real examples are used to illustrate the advantages.
- Abstract(参考訳): 潜在因子モデルの推定は通常、いくつかの観測された共変数を因子プロキシとして手動で選択するためにドメイン知識を使うか、主成分分析のような純粋に多変量解析を行うかのどちらかに依存する。
しかし、前者のアプローチはバイアスに悩まされ、後者は追加情報を組み込むことができない。
本稿では,これらの2つの手法を橋渡しし,因子プロキシの数を分散させ,潜在因子モデルの推定をより堅牢で柔軟で統計的に正確にすることを提案する。
ボーナスとして、要素数の増加も認められている。
提案手法の核心は,情報結合のためのペナルティを減じたランク回帰である。
さらに, 重み付きデータを扱うため, 計算に魅力的なペナライズされたロバスト低減ランク回帰法を提案する。
ベンチマークと比較すると,収束速度は速い。
強大なシミュレーションと実例は、その利点を説明するために使われる。
関連論文リスト
- Linked shrinkage to improve estimation of interaction effects in
regression models [0.0]
回帰モデルにおける双方向相互作用項によく適応する推定器を開発する。
我々は,選択戦略では難しい推論モデルの可能性を評価する。
私たちのモデルは、かなり大きなサンプルサイズであっても、ランダムな森林のような、より高度な機械学習者に対して非常に競争力があります。
論文 参考訳(メタデータ) (2023-09-25T10:03:39Z) - Mutual Wasserstein Discrepancy Minimization for Sequential
Recommendation [82.0801585843835]
逐次リコメンデーションのためのMutual WasserStein差分最小化MSteinに基づく新しい自己教師型学習フレームワークを提案する。
また,ワッサーシュタイン離散度測定に基づく新しい学習損失を提案する。
論文 参考訳(メタデータ) (2023-01-28T13:38:48Z) - Bayesian Hierarchical Models for Counterfactual Estimation [12.159830463756341]
本稿では,多種多様なカウンターファクトの集合を推定する確率的パラダイムを提案する。
摂動を事前分布関数によるランダム変数として扱う。
収束特性の優れた勾配ベースサンプリング器は、後方サンプルを効率的に計算する。
論文 参考訳(メタデータ) (2023-01-21T00:21:11Z) - Data Augmentation in the Underparameterized and Overparameterized
Regimes [7.326504492614808]
我々は,データの増大が推定値の分散と限定分布に与える影響を定量化する。
その結果、機械学習の実践において行われたいくつかの観察が確認できたが、予期せぬ発見につながった。
論文 参考訳(メタデータ) (2022-02-18T11:32:41Z) - Benign-Overfitting in Conditional Average Treatment Effect Prediction
with Linear Regression [14.493176427999028]
線形回帰モデルを用いて条件平均処理効果(CATE)の予測における良性過剰適合理論について検討した。
一方,IPW-learnerは確率スコアが分かっていればリスクをゼロに収束させるが,T-learnerはランダムな割り当て以外の一貫性を達成できないことを示す。
論文 参考訳(メタデータ) (2022-02-10T18:51:52Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - Latent Causal Invariant Model [128.7508609492542]
現在の教師付き学習は、データ適合プロセス中に急激な相関を学習することができる。
因果予測を求める潜在因果不変モデル(LaCIM)を提案する。
論文 参考訳(メタデータ) (2020-11-04T10:00:27Z) - DEMI: Discriminative Estimator of Mutual Information [5.248805627195347]
連続確率変数間の相互情報を推定することは、高次元データにとってしばしば難解で困難である。
近年の進歩は、相互情報の変動的下界を最適化するためにニューラルネットワークを活用している。
提案手法は,データサンプルペアが結合分布から引き出される確率を提供する分類器の訓練に基づく。
論文 参考訳(メタデータ) (2020-10-05T04:19:27Z) - An Investigation of Why Overparameterization Exacerbates Spurious
Correlations [98.3066727301239]
この動作を駆動するトレーニングデータの2つの重要な特性を特定します。
モデルの"記憶"に対する帰納的バイアスが,パラメータ化の超過を損なう可能性を示す。
論文 参考訳(メタデータ) (2020-05-09T01:59:13Z) - SUMO: Unbiased Estimation of Log Marginal Probability for Latent
Variable Models [80.22609163316459]
無限級数のランダム化トランケーションに基づく潜在変数モデルに対して、ログ境界確率の非バイアス推定器とその勾配を導入する。
推定器を用いてトレーニングしたモデルは、同じ平均計算コストに対して、標準的な重要度サンプリングに基づくアプローチよりも優れたテストセット確率を与えることを示す。
論文 参考訳(メタデータ) (2020-04-01T11:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。