論文の概要: Causal Matrix Completion
- arxiv url: http://arxiv.org/abs/2109.15154v1
- Date: Thu, 30 Sep 2021 14:17:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:56:39.949878
- Title: Causal Matrix Completion
- Title(参考訳): 因果行列の完成
- Authors: Anish Agarwal, Munther Dahleh, Devavrat Shah, Dennis Shen
- Abstract要約: マトリックス完備化(Matrix completion)は、ノイズ観測のスパース部分集合から基礎となる行列を復元する研究である。
伝統的に、行列の成分は「ランダムに完全に欠落している」と仮定される。
- 参考スコア(独自算出の注目度): 15.599296461516984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Matrix completion is the study of recovering an underlying matrix from a
sparse subset of noisy observations. Traditionally, it is assumed that the
entries of the matrix are "missing completely at random" (MCAR), i.e., each
entry is revealed at random, independent of everything else, with uniform
probability. This is likely unrealistic due to the presence of "latent
confounders", i.e., unobserved factors that determine both the entries of the
underlying matrix and the missingness pattern in the observed matrix. For
example, in the context of movie recommender systems -- a canonical application
for matrix completion -- a user who vehemently dislikes horror films is
unlikely to ever watch horror films. In general, these confounders yield
"missing not at random" (MNAR) data, which can severely impact any inference
procedure that does not correct for this bias. We develop a formal causal model
for matrix completion through the language of potential outcomes, and provide
novel identification arguments for a variety of causal estimands of interest.
We design a procedure, which we call "synthetic nearest neighbors" (SNN), to
estimate these causal estimands. We prove finite-sample consistency and
asymptotic normality of our estimator. Our analysis also leads to new
theoretical results for the matrix completion literature. In particular, we
establish entry-wise, i.e., max-norm, finite-sample consistency and asymptotic
normality results for matrix completion with MNAR data. As a special case, this
also provides entry-wise bounds for matrix completion with MCAR data. Across
simulated and real data, we demonstrate the efficacy of our proposed estimator.
- Abstract(参考訳): 行列完成(matrix completion)は、ノイズの少ない観測のサブセットから基礎となる行列を回復する研究である。
伝統的に、行列のエントリは「完全にランダム(mcar)」であり、すなわち各エントリはランダムに、他の全てとは無関係に、一様確率で明らかにされる。
これはおそらく「相対的共同設立者」、すなわち観測された行列の要素と欠落パターンの両方を決定する観測されていない要因の存在によって非現実的である。
例えば、映画レコメンデーションシステム(マトリックス完成のための標準的な応用)の文脈では、ホラー映画を熱心に嫌うユーザーはホラー映画を見ることはありそうにない。
一般的に、これらの共同設立者は「ランダムでないミス」(MNAR)データを生成し、このバイアスに対して正しくない推論手順に深刻な影響を与える可能性がある。
我々は、潜在的な結果の言語を通して行列完備のための形式的因果モデルを開発し、関心のある様々な因果推定に対して新しい識別引数を提供する。
我々は、これらの因果推定を推定するために、"synthetic Near neighbors"(SNN)と呼ばれる手順を設計する。
有限サンプル一貫性と漸近正規性が証明される。
また, 解析結果から, 行列完成文献の新たな理論的結果が得られた。
特に、MNARデータを用いた行列補完のためのエントリーワイド、すなわち、最大ノルム、有限サンプル整合および漸近正規化結果を確立する。
特別な場合として、これはMCARデータによる行列補完のエントリワイド境界も提供する。
シミュレーションおよび実データ全体で,提案した推定器の有効性を実証する。
関連論文リスト
- One-sided Matrix Completion from Two Observations Per Row [95.87811229292056]
行列の欠落値を$XTX$で計算する自然アルゴリズムを提案する。
合成データの一方の回収と低被覆ゲノムシークエンシングについて,本アルゴリズムの評価を行った。
論文 参考訳(メタデータ) (2023-06-06T22:35:16Z) - The Ordered Matrix Dirichlet for Modeling Ordinal Dynamics [54.96229007229786]
観測された動作タイプに潜伏状態のマッピングを行うための順序付き行列ディリクレ(OMD)を提案する。
OMD上に構築されたモデルでは、解釈可能な潜在状態を復元し、数ショット設定で優れた予測性能を示す。
論文 参考訳(メタデータ) (2022-12-08T08:04:26Z) - A Generalized Latent Factor Model Approach to Mixed-data Matrix
Completion with Entrywise Consistency [3.299672391663527]
マトリックスコンプリート(Matrix completion)は、部分的に観察された行列における欠落したエントリの予測に関する機械学習手法のクラスである。
非線型因子モデルの一般族の下での低ランク行列推定問題として定式化する。
低ランク行列を推定するためのエントリーワイドな一貫した推定器を提案する。
論文 参考訳(メタデータ) (2022-11-17T00:24:47Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Statistical limits of dictionary learning: random matrix theory and the
spectral replica method [28.54289139061295]
ベイズ最適設定における行列記述と辞書学習の複雑なモデルについて考察する。
本稿では, 統計力学とランダム行列理論, スペクトル複製法を組み合わせた新しいレプリカ法を提案する。
論文 参考訳(メタデータ) (2021-09-14T12:02:32Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Leveraged Matrix Completion with Noise [84.20092979053119]
未知の$ntimes n$ matrix of rank $r$ from just $mathcalO(nrlog2 (n))$ entry.
我々の証明は、ゴルフスキームに基づく十分な最適条件を記述する新しいアプローチによって支持されている。
論文 参考訳(メタデータ) (2020-11-11T16:25:45Z) - Adversarial Robust Low Rank Matrix Estimation: Compressed Sensing and
Matrix Completion [4.7210697296108926]
部分的な問題としてラッソを含む行列圧縮センシングと行列補完を扱う。
本稿では,ハマー損失関数と核ノルムのペナル化を組み合わせた単純な統一手法を提案する。
論文 参考訳(メタデータ) (2020-10-25T02:32:07Z) - Median Matrix Completion: from Embarrassment to Optimality [16.667260586938234]
絶対偏差損失を持つ行列の完全性を考察し,中央値行列の推定値を求める。
中央値のいくつかの魅力的な性質にもかかわらず、非滑らかな絶対偏差損失は計算に挑戦する。
そこで我々は,非効率な推定器を(最適に近い)行列補完手順に変換する改良ステップを提案する。
論文 参考訳(メタデータ) (2020-06-18T10:01:22Z) - Robust Compressed Sensing using Generative Models [98.64228459705859]
本稿では,Median-of-Means (MOM) にヒントを得たアルゴリズムを提案する。
我々のアルゴリズムは、外れ値が存在する場合でも、重み付きデータの回復を保証する。
論文 参考訳(メタデータ) (2020-06-16T19:07:41Z) - Robust Matrix Completion with Mixed Data Types [0.0]
我々は,データ型が混在する部分的なエントリを持つ構造的低ランク行列を復元する問題を考察する。
ほとんどのアプローチは、基礎となる分布は1つしかないと仮定し、低階の制約は、行列 Satten Norm によって正則化される。
本稿では, 並列化に適したアルゴリズムフレームワークとともに, 高い回復保証を有する計算可能な統計手法を提案し, 混合データ型に対する部分的に観測されたエントリを持つ低階行列を1ステップで復元する。
論文 参考訳(メタデータ) (2020-05-25T21:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。