論文の概要: Sample efficient inductive matrix completion with noise and inexact side information
- arxiv url: http://arxiv.org/abs/2605.17189v1
- Date: Sat, 16 May 2026 23:10:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.727597
- Title: Sample efficient inductive matrix completion with noise and inexact side information
- Title(参考訳): 雑音と不正確な側情報を用いたサンプル効率のインダクティブ行列の合成
- Authors: Yuepeng Yang, Cong Ma,
- Abstract要約: 低ランク行列完備化は多くの変種で広く研究されている問題である。
帰納行列補完(IMC)は行と列の側情報を組み込んで探索空間を著しく狭める。
- 参考スコア(独自算出の注目度): 7.5686409814551245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Low-rank matrix completion is a widely studied problem with many variants. Inductive matrix completion (IMC) incorporates row and column side information to significantly narrow the search space. Prior work falls into two regimes: methods that exploit this structure to achieve reduced sample complexity but only in noiseless settings, and methods that handle noise but require sample complexity matching the ambient matrix dimension, forfeiting the sample efficiency that side information should provide. In this paper, we close this gap by studying noisy IMC with a nonconvex projected gradient descent algorithm with spectral initialization. Our main technical contribution is establishing a regularity condition for the IMC loss function that holds at the reduced sample complexity determined by the effective problem size, scaling with the side information dimension a rather than the ambient dimension n. This directly yields linear convergence and an estimation error that both depend only on the effective problem size rather than the ambient matrix dimension. We further extend our analysis to the inexact side information setting, demonstrating that the reduced sample complexity is maintained and the estimation error is order-optimal with respect to the inexactness of the side information. Extensive simulations and real-world experiments on the MovieLens dataset validate our theoretical findings.
- Abstract(参考訳): 低ランク行列完備化は多くの変種で広く研究されている問題である。
帰納行列補完(IMC)は行と列の側情報を組み込んで探索空間を著しく狭める。
従来の作業は、サンプルの複雑さを減らすためにこの構造を利用する手法と、ノイズを処理するが、周囲の行列次元にマッチするサンプルの複雑さを必要とする手法の2つに分類され、側が提供すべきサンプルの効率が低下する。
本稿では、スペクトル初期化を伴う非凸射影勾配降下アルゴリズムを用いて、ノイズの多いIMCを研究することにより、このギャップを埋める。
我々の主な技術的貢献は、実効的な問題の大きさによって決定されるサンプルの複雑さを抑えるIMC損失関数の正則性条件を確立することであり、周囲次元nではなく側情報次元aでスケーリングすることである。
これにより直線収束と推定誤差が直接発生し、どちらも周囲の行列次元よりも有効な問題サイズにのみ依存する。
我々はさらに、分析結果を不正確な側情報設定にまで拡張し、サンプルの複雑さの低減が維持され、その側情報の不正確な点に関して、推定誤差が順序最適であることを実証した。
MovieLensデータセットの大規模なシミュレーションと実世界の実験により、我々の理論的な結果が検証された。
関連論文リスト
- A Simple Method for PMF Estimation on Large Supports [0.7163391346004578]
本研究では,PMF が多モードかつ重み付きである大規模離散支持体上での確率質量関数 (PMF) の非パラメトリック推定について検討した。
経験的PMFをこの低次元部分空間に投影すると、ノイズを抑えながら粗い構造を保存する滑らかなマルチモーダル推定が得られる。
この方法は実装が短く、サンプルサイズにまたがって堅牢であり、信頼性と速度のため、自動パイプラインと大規模探索分析に適している。
論文 参考訳(メタデータ) (2025-10-16T20:47:40Z) - A Sample Efficient Alternating Minimization-based Algorithm For Robust Phase Retrieval [56.67706781191521]
そこで本研究では,未知の信号の復元を課題とする,ロバストな位相探索問題を提案する。
提案するオラクルは、単純な勾配ステップと外れ値を用いて、計算学的スペクトル降下を回避している。
論文 参考訳(メタデータ) (2024-09-07T06:37:23Z) - Leave-One-Out Analysis for Nonconvex Robust Matrix Completion with General Thresholding Functions [7.697455644733554]
我々は、ロバスト完備行列(RMC)の問題をランク付けする。
解析には単純だが効率的なアルゴリズムを考える。
最高のサンプリング結果を得るためには、これが最初のランクアウト分析法である。
論文 参考訳(メタデータ) (2024-07-28T09:47:36Z) - Gradient-Based Feature Learning under Structured Data [57.76552698981579]
異方性設定では、一般的に使用される球面勾配力学は真の方向を回復できないことがある。
バッチ正規化を連想させる適切な重み正規化は、この問題を軽減することができることを示す。
特に、スパイクモデルの下では、勾配に基づくトレーニングのサンプルの複雑さは情報指数とは独立にできる。
論文 参考訳(メタデータ) (2023-09-07T16:55:50Z) - Linearly-scalable learning of smooth low-dimensional patterns with
permutation-aided entropic dimension reduction [0.0]
多くのデータサイエンス応用において、高次元データセットから適切に順序付けられた滑らかな低次元データパターンを抽出することが目的である。
本研究では, ユークリッドの滑らか度をパターン品質基準として選択する場合, これらの問題を数値的に効率的に解けることを示す。
論文 参考訳(メタデータ) (2023-06-17T08:03:24Z) - Differentiable Annealed Importance Sampling and the Perils of Gradient
Noise [68.44523807580438]
Annealed importance sample (AIS) と関連するアルゴリズムは、限界推定のための非常に効果的なツールである。
差別性は、目的として限界確率を最適化する可能性を認めるため、望ましい性質である。
我々はメトロポリス・ハスティングスのステップを放棄して微分可能アルゴリズムを提案し、ミニバッチ計算をさらに解き放つ。
論文 参考訳(メタデータ) (2021-07-21T17:10:14Z) - Towards Sample-Optimal Compressive Phase Retrieval with Sparse and
Generative Priors [59.33977545294148]
O(k log L)$サンプルは振幅に基づく経験損失関数を最小化する任意のベクトルに信号が近いことを保証するのに十分であることを示す。
この結果はスパース位相検索に適応し、基底信号が$s$-sparseおよび$n$-dimensionalである場合、$O(s log n)$サンプルは同様の保証に十分であることを示す。
論文 参考訳(メタデータ) (2021-06-29T12:49:54Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Evaluating representations by the complexity of learning low-loss
predictors [55.94170724668857]
下流タスクの解決に使用されるデータの表現を評価することの問題点を考察する。
本稿では,関心のあるタスクにおける低損失を実現する表現の上に,予測器を学習する複雑性によって表現の質を測定することを提案する。
論文 参考訳(メタデータ) (2020-09-15T22:06:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。