論文の概要: Matrix Completion with Noise via Leveraged Sampling
- arxiv url: http://arxiv.org/abs/2011.05885v1
- Date: Wed, 11 Nov 2020 16:25:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 23:24:11.548578
- Title: Matrix Completion with Noise via Leveraged Sampling
- Title(参考訳): レバレッジサンプリングによる雑音のマトリックス補完
- Authors: Xinjian Huang and Weiwei Liu and Bo Du
- Abstract要約: ほとんどの現実世界のアプリケーションでは、データマトリックスのリカバリは不完全であり、おそらくは破損した情報である。
本稿では,低ランク行列の回復について考察する。
観測された少数のエントリが少量のノイズ情報で破損しても、未知の$ntimes n$ matrix of rank $r$ from just $O(nrlog2 n)$ entry を確実に回収できることが示される。
- 参考スコア(独自算出の注目度): 38.441282034711215
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many matrix completion methods assume that the data follows the uniform
distribution. To address the limitation of this assumption, Chen et al.
\cite{Chen20152999} propose to recover the matrix where the data follows the
specific biased distribution. Unfortunately, in most real-world applications,
the recovery of a data matrix appears to be incomplete, and perhaps even
corrupted information. This paper considers the recovery of a low-rank matrix,
where some observed entries are sampled in a \emph{biased distribution}
suitably dependent on \emph{leverage scores} of a matrix, and some observed
entries are uniformly corrupted. Our theoretical findings show that we can
provably recover an unknown $n\times n$ matrix of rank $r$ from just about
$O(nr\log^2 n)$ entries even when the few observed entries are corrupted with a
small amount of noisy information. Empirical studies verify our theoretical
results.
- Abstract(参考訳): 多くの行列補完法は、データが一様分布に従うと仮定する。
この仮定の限界に対処するため、 Chen ら。
\cite{Chen20152999} は、データが特定のバイアス分布に従う行列を復元することを提案する。
残念なことに、ほとんどの現実世界のアプリケーションでは、データマトリックスのリカバリは不完全であり、おそらくは破損した情報である。
本稿では, 観測項目のいくつかを, 行列の \emph{leverage score} に好適に依存する \emph{biased distribution} にサンプリングし, 観測項目のいくつかは一様に破損する低ランク行列の回復を検討する。
我々の理論的な知見は、観測された少数のエントリが小さなノイズ情報で破損しても、未知の$n\times n$Matrix of rank $r$をちょうど$O(nr\log^2 n)$ entryから確実に回収できることを示している。
実証研究は我々の理論的結果を検証する。
関連論文リスト
- Optimal level set estimation for non-parametric tournament and crowdsourcing problems [49.75262185577198]
クラウドソーシングによって動機づけられた我々は、$d$の質問に対する$n$の専門家の回答の正しさを部分的に観察する問題を考える。
本稿では、専門家$i$が疑問に答える確率を含む行列$M$が、行と列の置換までの双等方性であることを仮定する。
我々は,この分類問題に対して最小限のアルゴリズムを最適に構築する。
論文 参考訳(メタデータ) (2024-08-27T18:28:31Z) - Entrywise error bounds for low-rank approximations of kernel matrices [55.524284152242096]
切り抜き固有分解を用いて得られたカーネル行列の低ランク近似に対するエントリーワイド誤差境界を導出する。
重要な技術的革新は、小さな固有値に対応するカーネル行列の固有ベクトルの非局在化結果である。
我々は、合成および実世界のデータセットの集合に関する実証的研究により、我々の理論を検証した。
論文 参考訳(メタデータ) (2024-05-23T12:26:25Z) - One-sided Matrix Completion from Two Observations Per Row [95.87811229292056]
行列の欠落値を$XTX$で計算する自然アルゴリズムを提案する。
合成データの一方の回収と低被覆ゲノムシークエンシングについて,本アルゴリズムの評価を行った。
論文 参考訳(メタデータ) (2023-06-06T22:35:16Z) - Robust Matrix Completion with Heavy-tailed Noise [0.5837881923712392]
本稿では,重み付き潜在的非対称雑音の存在下での低ランク行列の完全性について検討する。
本稿では,大規模かつ非対称な誤りに対して頑健な重み付き雑音に適応するハマー損失を適応的に適用する。
誤差の2番目のモーメント条件下では、ユークリッド誤差は最小値の統計的推定誤差に到達するまで幾何的に早く落ちることが証明される。
論文 参考訳(メタデータ) (2022-06-09T04:48:48Z) - Robust Linear Regression for General Feature Distribution [21.0709900887309]
本研究では, 不正な相手によってデータが汚染されるような頑健な線形回帰について検討する。
必ずしもその機能が中心であるとは限らない。
特徴が中心ならば、標準収束率を得ることができる。
論文 参考訳(メタデータ) (2022-02-04T11:22:13Z) - Robust Linear Predictions: Analyses of Uniform Concentration, Fast Rates
and Model Misspecification [16.0817847880416]
ヒルベルト空間上の様々な線形予測問題を含む統一的なフレームワークを提供する。
誤特定レベル $epsilon$ に対して、これらの推定器は、文献で最もよく知られたレートと一致する、$O(maxleft|mathcalO|1/2n-1/2, |mathcalI|1/2n-1 right+epsilon)$ の誤差率を達成する。
論文 参考訳(メタデータ) (2022-01-06T08:51:08Z) - Consistent Estimation for PCA and Sparse Regression with Oblivious
Outliers [13.244654316770815]
我々は効率よく計算可能で一貫した推定器を設計する機械を開発する。
スパース回帰では、最適なサンプルサイズ$ngsim (klog d)/alpha2$の整合性を達成する。
PCAの文脈では、パラメータ行列上の広いスパイキネス仮定の下で最適な誤差を保証する。
論文 参考訳(メタデータ) (2021-11-04T15:59:44Z) - Under-bagging Nearest Neighbors for Imbalanced Classification [63.026765294759876]
我々は,不均衡な分類問題に対して,textitunder-bagging $k$-NN (textitunder-bagging $k$-NN) というアンサンブル学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-01T14:10:38Z) - Sharp Statistical Guarantees for Adversarially Robust Gaussian
Classification [54.22421582955454]
逆向きに頑健な分類の過剰リスクに対する最適ミニマックス保証の最初の結果を提供する。
結果はAdvSNR(Adversarial Signal-to-Noise Ratio)の項で述べられており、これは標準的な線形分類と逆数設定との類似の考え方を一般化している。
論文 参考訳(メタデータ) (2020-06-29T21:06:52Z) - Tackling small eigen-gaps: Fine-grained eigenvector estimation and
inference under heteroscedastic noise [28.637772416856194]
ノイズの観測から、固有ベクトル推定と低ランク行列の推測に2つの根本的な課題が生じる。
未知固有ベクトルに対する推定と不確実性定量化手法を提案する。
未知固有値に対する信頼区間を構築するための最適手順を確立する。
論文 参考訳(メタデータ) (2020-01-14T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。