論文の概要: Doubly robust nearest neighbors in factor models
- arxiv url: http://arxiv.org/abs/2211.14297v3
- Date: Tue, 30 Jan 2024 03:16:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 20:08:55.152009
- Title: Doubly robust nearest neighbors in factor models
- Title(参考訳): 因子モデルにおける二重強近傍
- Authors: Raaz Dwivedi, Katherine Tian, Sabina Tomkins, Predrag Klasnja, Susan
Murphy, Devavrat Shah
- Abstract要約: 我々は、潜在因子モデルにおける欠落データを用いた推定のために、近距離隣人(NN)の改良版を導入・分析する。
私たちの見積は2つの点でこの赤字に対して二重に堅牢です。
- 参考スコア(独自算出の注目度): 18.879990421340363
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce and analyze an improved variant of nearest neighbors (NN) for
estimation with missing data in latent factor models. We consider a matrix
completion problem with missing data, where the $(i, t)$-th entry, when
observed, is given by its mean $f(u_i, v_t)$ plus mean-zero noise for an
unknown function $f$ and latent factors $u_i$ and $v_t$. Prior NN strategies,
like unit-unit NN, for estimating the mean $f(u_i, v_t)$ relies on existence of
other rows $j$ with $u_j \approx u_i$. Similarly, time-time NN strategy relies
on existence of columns $t'$ with $v_{t'} \approx v_t$. These strategies
provide poor performance respectively when similar rows or similar columns are
not available. Our estimate is doubly robust to this deficit in two ways: (1)
As long as there exist either good row or good column neighbors, our estimate
provides a consistent estimate. (2) Furthermore, if both good row and good
column neighbors exist, it provides a (near-)quadratic improvement in the
non-asymptotic error and admits a significantly narrower asymptotic confidence
interval when compared to both unit-unit or time-time NN.
- Abstract(参考訳): 潜在因子モデルに欠落データを含む推定のために,改良された近距離近傍(nn)の変種を導入し,解析する。
i, t)$-th エントリが観測されたとき、その平均 $f(u_i, v_t)$ と、未知関数 $f$ と潜在係数 $u_i$ と $v_t$ の平均-ゼロノイズによって与えられる、データ不足による行列補完問題を考える。
平均$f(u_i, v_t)$を推定する以前のNN戦略は、$u_j \approx u_i$の他の行の存在に依存している。
同様に、時刻NN戦略は$t'$と$v_{t'} \approx v_t$の存在に依存している。
これらの戦略は、類似の行や類似の列が利用できない場合にそれぞれ性能が低下する。
1)良い行または良い列の隣人が存在する限り、我々の見積もりは一貫した見積もりを提供する。
2)さらに,良行と良列近傍の両方が存在する場合,非漸近誤差の(ほぼ)クアドドラティックな改善が得られ,単位単位と時間単位のnnと比較して,漸近的信頼区間がかなり狭くなる。
関連論文リスト
- Improved convergence rate of kNN graph Laplacians [11.93971616098517]
k$NNグラフの一般クラスで、グラフ親和性は$W_ij = epsilon-d/2 である。
制限多様体作用素に対する$k$NNグラフ Laplacian の点収束性を証明する。
論文 参考訳(メタデータ) (2024-10-30T17:01:00Z) - Statistical-Computational Trade-offs for Density Estimation [60.81548752871115]
幅広い種類のデータ構造に対して、それらの境界は著しく改善されないことを示す。
これは密度推定のための新しい統計計算トレードオフである。
論文 参考訳(メタデータ) (2024-10-30T15:03:33Z) - Estimating Optimal Policy Value in General Linear Contextual Bandits [50.008542459050155]
多くのバンドイット問題において、政策によって達成可能な最大報酬は、前もって不明であることが多い。
我々は,最適政策が学習される前に,サブ線形データ構造における最適政策値を推定する問題を考察する。
V*$で問題依存上界を推定する,より実用的で効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-19T01:09:24Z) - Uncertainty Quantification of MLE for Entity Ranking with Covariates [3.2839905453386162]
本稿では,ペア比較に基づくランキング問題の統計的推定と推定について検討する。
我々は、有名なBradley-Terry-Luceモデルを拡張した新しいモデルCAREモデルを提案する。
我々は、スパース比較グラフの下で、$alpha_i*_i=1n$と$beta*$の最大確率推定器を導出する。
大規模数値研究による理論結果の検証と相互資金保有データセットへの適用について検討する。
論文 参考訳(メタデータ) (2022-12-20T02:28:27Z) - Nonparametric Matrix Estimation with One-Sided Covariates [5.457150493905064]
mathbbRntimes m$ のデータセット $X をスパシティ $p$ で観測する行列推定のタスクを考える。
我々は,行数が小さすぎる場合に,各行を別々に推定することで,アルゴリズムの精度が向上することを示すアルゴリズムと解析を提供する。
論文 参考訳(メタデータ) (2021-10-26T19:11:45Z) - Under-bagging Nearest Neighbors for Imbalanced Classification [63.026765294759876]
我々は,不均衡な分類問題に対して,textitunder-bagging $k$-NN (textitunder-bagging $k$-NN) というアンサンブル学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-01T14:10:38Z) - Localization in 1D non-parametric latent space models from pairwise
affinities [6.982738885923206]
対の親和性から一次元トーラスにおける潜伏位置を推定する問題を考察する。
高確率でsqrtlog(n)/n$の順序の最大誤差で全ての潜伏位置を確実にローカライズする推定手順を導入する。
論文 参考訳(メタデータ) (2021-08-06T13:05:30Z) - List-Decodable Mean Estimation in Nearly-PCA Time [50.79691056481693]
高次元におけるリストデコタブル平均推定の基本的な課題について検討する。
我々のアルゴリズムは、すべての$k = O(sqrtd) cup Omega(d)$に対して$widetildeO(ndk)$で実行されます。
我々のアルゴリズムの変種は、すべての$k$に対してランタイム$widetildeO(ndk)$を持ち、リカバリ保証の$O(sqrtlog k)$ Factorを犠牲にしている。
論文 参考訳(メタデータ) (2020-11-19T17:21:37Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z) - Second-Order Information in Non-Convex Stochastic Optimization: Power
and Limitations [54.42518331209581]
私たちは発見するアルゴリズムを見つけます。
epsilon$-approximate stationary point ($|nabla F(x)|le epsilon$) using
$(epsilon,gamma)$surimateランダムランダムポイント。
ここでの私たちの下限は、ノイズのないケースでも新規です。
論文 参考訳(メタデータ) (2020-06-24T04:41:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。