論文の概要: Exploiting Observation Bias to Improve Matrix Completion
- arxiv url: http://arxiv.org/abs/2306.04775v2
- Date: Mon, 5 Feb 2024 00:25:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 06:18:21.775285
- Title: Exploiting Observation Bias to Improve Matrix Completion
- Title(参考訳): マトリックスの完成度向上のための爆発観測バイアス
- Authors: Yassir Jedra, Sean Mann, Charlotte Park, Devavrat Shah
- Abstract要約: 本稿では,行列補完の変種について考察する。
目標は、バイアスと関心の結果の間の共有情報を利用して予測を改善することである。
この2段階のアルゴリズムでは,従来の行列補完法に比べて平均2乗誤差が30倍小さいことが判明した。
- 参考スコア(独自算出の注目度): 16.57405742112833
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a variant of matrix completion where entries are revealed in a
biased manner, adopting a model akin to that introduced by Ma and Chen. Instead
of treating this observation bias as a disadvantage, as is typically the case,
the goal is to exploit the shared information between the bias and the outcome
of interest to improve predictions. Towards this, we consider a natural model
where the observation pattern and outcome of interest are driven by the same
set of underlying latent or unobserved factors. This leads to a two stage
matrix completion algorithm: first, recover (distances between) the latent
factors by utilizing matrix completion for the fully observed noisy binary
matrix corresponding to the observation pattern; second, utilize the recovered
latent factors as features and sparsely observed noisy outcomes as labels to
perform non-parametric supervised learning. The finite-sample error rates
analysis suggests that, ignoring logarithmic factors, this approach is
competitive with the corresponding supervised learning parametric rates. This
implies the two-stage method has performance that is comparable to having
access to the unobserved latent factors through exploiting the shared
information between the bias and outcomes. Through empirical evaluation using a
real-world dataset, we find that with this two-stage algorithm, the estimates
have 30x smaller mean squared error compared to traditional matrix completion
methods, suggesting the utility of the model and the method proposed in this
work.
- Abstract(参考訳): 本稿では,Ma と Chen が導入したモデルに類似したモデルを用いて,入出力をバイアス的に明らかにする行列補完の変種を考える。
通常の場合のように、この観察バイアスを不利として扱う代わりに、目標は、バイアスと関心の結果の間の共有情報を利用して予測を改善することである。
これに向けて,観測パターンと興味の成果が,基礎となる潜在要因や観測されていない要因の同じ集合によって駆動される自然モデルを考える。
このアルゴリズムは2段階の行列補完アルゴリズムを導出する: まず、観測パターンに対応する完全観測された雑音二乗行列に対する行列補完を利用して遅延因子を復元する; 次に、得られた遅延因子を特徴として利用し、緩やかに観測された雑音の結果をラベルとして、非パラメトリック教師付き学習を行う。
有限サンプル誤差率解析は、対数的因子を無視して、このアプローチが対応する教師付き学習パラメトリックレートと競合することを示唆している。
これは、2段階の手法がバイアスと結果の間の共有情報を活用することによって、観測されていない潜在要因へのアクセスに匹敵する性能を持つことを意味する。
実世界のデータセットを用いた経験的評価により, この2段階のアルゴリズムでは, 従来の行列補完法に比べて平均2乗誤差が30倍小さく, モデルの有用性と提案手法が示唆された。
関連論文リスト
- MANO: Exploiting Matrix Norm for Unsupervised Accuracy Estimation Under Distribution Shifts [25.643876327918544]
モデルのアウトプット、特にロジットを活用することは、トレーニング済みニューラルネットワークのテスト精度を、アウト・オブ・ディストリビューションのサンプルで推定する一般的なアプローチである。
実装の容易さと計算効率にもかかわらず、現在のロジットベースの手法は過信問題に弱いため、予測バイアスにつながる。
予測バイアスを低減するためにデータ依存正規化を適用したMaNoを提案し,正規化ロジットの行列の$L_p$ノルムを推定スコアとする。
論文 参考訳(メタデータ) (2024-05-29T10:45:06Z) - A Generalized Latent Factor Model Approach to Mixed-data Matrix
Completion with Entrywise Consistency [3.299672391663527]
マトリックスコンプリート(Matrix completion)は、部分的に観察された行列における欠落したエントリの予測に関する機械学習手法のクラスである。
非線型因子モデルの一般族の下での低ランク行列推定問題として定式化する。
低ランク行列を推定するためのエントリーワイドな一貫した推定器を提案する。
論文 参考訳(メタデータ) (2022-11-17T00:24:47Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Never mind the metrics -- what about the uncertainty? Visualising
confusion matrix metric distributions [6.566615606042994]
本稿では,不確実性の異なるモデル下での分布を明らかにすることにより,分類器の性能指標について,よりバランスのとれた視点を求める。
我々は、このROC空間内の(そしてそれ以上の)パフォーマンスメトリクスの輪郭の方程式、アニメーション、インタラクティブな可視化を開発します。
私たちの期待は、これらの洞察と視覚化によって、パフォーマンス指標の推定における実質的な不確実性に対する認識がより高くなることです。
論文 参考訳(メタデータ) (2022-06-05T11:54:59Z) - Masked prediction tasks: a parameter identifiability view [49.533046139235466]
マスク付きトークンの予測に広く用いられている自己教師型学習手法に着目する。
いくつかの予測タスクは識別可能性をもたらすが、他のタスクはそうではない。
論文 参考訳(メタデータ) (2022-02-18T17:09:32Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Doing Great at Estimating CATE? On the Neglected Assumptions in
Benchmark Comparisons of Treatment Effect Estimators [91.3755431537592]
もっとも単純な設定であっても、無知性仮定に基づく推定は誤解を招く可能性があることを示す。
異種処理効果評価のための機械学習ベンチマークデータセットを2つ検討した。
ベンチマークデータセットの固有の特性が、他のものよりもいくつかのアルゴリズムを好んでいる点を強調します。
論文 参考訳(メタデータ) (2021-07-28T13:21:27Z) - Counterfactual Maximum Likelihood Estimation for Training Deep Networks [83.44219640437657]
深層学習モデルは、予測的手がかりとして学習すべきでない急激な相関を学習する傾向がある。
本研究では,観測可能な共同設立者による相関関係の緩和を目的とした因果関係に基づくトレーニングフレームワークを提案する。
自然言語推論(NLI)と画像キャプションという2つの実世界の課題について実験を行った。
論文 参考訳(メタデータ) (2021-06-07T17:47:16Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Estimating Treatment Effects with Observed Confounders and Mediators [25.338901482522648]
因果グラフが与えられた場合、do-calculusは経験的に推定できる観察関節分布の関数として治療効果を表現することができる。
時折、do-calculusは複数の有効な公式を識別し、対応する推定器の統計特性を比較するように促す。
本稿では,共同創設者と仲介者の両方が観察される過度に同定されたシナリオについて検討し,両推定手法の有効性を検証した。
論文 参考訳(メタデータ) (2020-03-26T15:50:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。