論文の概要: Bounded Simplex-Structured Matrix Factorization: Algorithms,
Identifiability and Applications
- arxiv url: http://arxiv.org/abs/2209.12638v2
- Date: Fri, 31 Mar 2023 06:59:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 17:29:45.490937
- Title: Bounded Simplex-Structured Matrix Factorization: Algorithms,
Identifiability and Applications
- Title(参考訳): 有界単純x構造行列分解:アルゴリズム、識別可能性および応用
- Authors: Olivier Vu Thanh, Nicolas Gillis, Fabian Lecron
- Abstract要約: 単純構造行列分解(BSSMF)と呼ばれる新しい低ランク行列分解モデルを提案する。
BSSMF は入力行列 $X$ のエントリが与えられた間隔に属するときに特に適している。
本稿では,まずBSSMFの高速アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 20.836492835594843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a new low-rank matrix factorization model dubbed
bounded simplex-structured matrix factorization (BSSMF). Given an input matrix
$X$ and a factorization rank $r$, BSSMF looks for a matrix $W$ with $r$ columns
and a matrix $H$ with $r$ rows such that $X \approx WH$ where the entries in
each column of $W$ are bounded, that is, they belong to given intervals, and
the columns of $H$ belong to the probability simplex, that is, $H$ is column
stochastic. BSSMF generalizes nonnegative matrix factorization (NMF), and
simplex-structured matrix factorization (SSMF). BSSMF is particularly well
suited when the entries of the input matrix $X$ belong to a given interval; for
example when the rows of $X$ represent images, or $X$ is a rating matrix such
as in the Netflix and MovieLens datasets where the entries of $X$ belong to the
interval $[1,5]$. The simplex-structured matrix $H$ not only leads to an easily
understandable decomposition providing a soft clustering of the columns of $X$,
but implies that the entries of each column of $WH$ belong to the same
intervals as the columns of $W$. In this paper, we first propose a fast
algorithm for BSSMF, even in the presence of missing data in $X$. Then we
provide identifiability conditions for BSSMF, that is, we provide conditions
under which BSSMF admits a unique decomposition, up to trivial ambiguities.
Finally, we illustrate the effectiveness of BSSMF on two applications:
extraction of features in a set of images, and the matrix completion problem
for recommender systems.
- Abstract(参考訳): 本稿では,BSSMF (bounded simplex-structured matrix factorization) と呼ばれる新しい低ランク行列分解モデルを提案する。
入力行列 $x$ と因子化ランク $r$ が与えられると、bssmf は$r$ の列を持つ行列 $w$ と $r$ の列を持つ行列 $h$ を探し、$x \approx wh$ となる。
BSSMFは非負行列分解 (NMF) と単純構造行列分解 (SSMF) を一般化する。
例えば、$x$ の行が画像を表す場合や$x$ は netflix や movielens のデータセットのような評価行列であり、$x$ のエントリは$[1,5]$ のインターバルに属する場合などである。
単純x構造行列 $h$ は、容易に理解可能な分解をもたらすだけでなく、$x$ のカラムのソフトクラスタリングを提供するだけでなく、$wh$ の各列のエントリが $w$ の列と同じ間隔に属することを意味する。
本稿では,まずBSSMFの高速アルゴリズムを提案する。
次に、BSSMFの識別可能性条件、すなわち、BSSMFが一意的な分解を許容する条件を自明な曖昧さまで提供する。
最後に,画像群における特徴抽出と推薦システムにおける行列補完問題という2つの応用におけるbssmfの有効性について述べる。
関連論文リスト
- LevAttention: Time, Space, and Streaming Efficient Algorithm for Heavy Attentions [54.54897832889028]
任意の$K$に対して、$n$とは独立に「普遍集合」$Uサブセット[n]$が存在し、任意の$Q$と任意の行$i$に対して、大きな注目スコアが$A_i,j$ in row $i$ of $A$は全て$jin U$を持つことを示す。
我々は、視覚変換器のスキームの利点を実証的に示し、トレーニング中に我々の普遍的なセットを使用する新しいモデルのトレーニング方法を示した。
論文 参考訳(メタデータ) (2024-10-07T19:47:13Z) - One-sided Matrix Completion from Two Observations Per Row [95.87811229292056]
行列の欠落値を$XTX$で計算する自然アルゴリズムを提案する。
合成データの一方の回収と低被覆ゲノムシークエンシングについて,本アルゴリズムの評価を行った。
論文 参考訳(メタデータ) (2023-06-06T22:35:16Z) - Spectral properties of sample covariance matrices arising from random
matrices with independent non identically distributed columns [50.053491972003656]
関数 $texttr(AR(z))$, for $R(z) = (frac1nXXT- zI_p)-1$ and $Ain mathcal M_p$ deterministic, have a standard deviation of order $O(|A|_* / sqrt n)$.
ここでは、$|mathbb E[R(z)] - tilde R(z)|_F を示す。
論文 参考訳(メタデータ) (2021-09-06T14:21:43Z) - Likelihood estimation of sparse topic distributions in topic models and
its applications to Wasserstein document distance calculations [3.679981089267181]
トピックモデルでは、$ptimes n$予測ワード頻度行列は$ptimes K$ワードトピック行列$A$として分解される。
A$の列は、すべてのドキュメントに共通する$p$の混合コンポーネントと見なされる。
A$が未知の場合、プラグインに対応する可能性関数を最適化して$T$を見積もる。
論文 参考訳(メタデータ) (2021-07-12T22:22:32Z) - Learning a Latent Simplex in Input-Sparsity Time [58.30321592603066]
我々は、$AinmathbbRdtimes n$へのアクセスを考えると、潜入$k$-vertex simplex $KsubsetmathbbRdtimes n$を学習する問題を考える。
実行時間における$k$への依存は、トップ$k$特異値の質量が$a$であるという自然な仮定から不要であることを示す。
論文 参考訳(メタデータ) (2021-05-17T16:40:48Z) - The Average-Case Time Complexity of Certifying the Restricted Isometry
Property [66.65353643599899]
圧縮センシングにおいて、100万倍のN$センシング行列上の制限等尺性(RIP)はスパースベクトルの効率的な再構成を保証する。
Mtimes N$ matrices with i.d.$mathcalN(0,1/M)$ entry。
論文 参考訳(メタデータ) (2020-05-22T16:55:01Z) - Average Case Column Subset Selection for Entrywise $\ell_1$-Norm Loss [76.02734481158458]
最悪の場合、行列に対する良いランク-$k$近似を得るには、任意に大きい$nOmega(1)$列数が必要であることが知られている。
最小かつ現実的な分布設定では、ほぼ線形な実行時間を持つ$(k/epsilon)$-approximationとpoly$(k/epsilon)+O(klog n)$ columnsが得られる。
これは、エントリワイズで$(k/epsilon)$-approximationを達成するための任意の種類の最初のアルゴリズムである
論文 参考訳(メタデータ) (2020-04-16T22:57:06Z) - Optimal estimation of sparse topic models [3.308743964406688]
本稿では、要素的にスパースである可能性のある$A$の推定について検討し、$K$のトピックの数は不明である。
我々は、そのような$A$を推定するための新しいミニマックスローバウンドを導出し、そのリカバリのための新しい計算効率の良いアルゴリズムを提案する。
我々の推定値は、未知の$A$に適応し、我々の分析は、任意の有限$n$、$p$、$K$および文書長に対して有効である。
論文 参考訳(メタデータ) (2020-01-22T03:19:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。