論文の概要: Nonnegative Matrix Factorization in the Component-Wise L1 Norm for Sparse Data
- arxiv url: http://arxiv.org/abs/2603.29715v1
- Date: Tue, 31 Mar 2026 13:16:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.676038
- Title: Nonnegative Matrix Factorization in the Component-Wise L1 Norm for Sparse Data
- Title(参考訳): スパースデータに対する成分幅L1ノルムの非負行列因子化
- Authors: Giovanni Seraghiti, Kévin Dubrulle, Arnaud Vandaele, Nicolas Gillis,
- Abstract要約: 誤差測度(L1-NMF)としてコンポーネントワイドL1ノルムを用いた非負行列分解(NMF)を考える。
最初の寄与は L1-NMF に対する NP-ハードネス証明であり、$r=1$ であっても、最小二乗を使用する標準 NMF とは対照的である。
第3の貢献は、重み付きL1-NMF(wL1-NMF)と呼ばれるスパースデータのための、より一般的な新しいL1-NMFモデルである。
- 参考スコア(独自算出の注目度): 9.842769671181276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nonnegative matrix factorization (NMF) approximates a nonnegative matrix, $X$, by the product of two nonnegative factors, $WH$, where $W$ has $r$ columns and $H$ has $r$ rows. In this paper, we consider NMF using the component-wise L1 norm as the error measure (L1-NMF), which is suited for data corrupted by heavy-tailed noise, such as Laplace noise or salt and pepper noise, or in the presence of outliers. Our first contribution is an NP-hardness proof for L1-NMF, even when $r=1$, in contrast to the standard NMF that uses least squares. Our second contribution is to show that L1-NMF strongly enforces sparsity in the factors for sparse input matrices, thereby favoring interpretability. However, if the data is affected by false zeros, too sparse solutions might degrade the model. Our third contribution is a new, more general, L1-NMF model for sparse data, dubbed weighted L1-NMF (wL1-NMF), where the sparsity of the factorization is controlled by adding a penalization parameter to the entries of $WH$ associated with zeros in the data. The fourth contribution is a new coordinate descent (CD) approach for wL1-NMF, denoted as sparse CD (sCD), where each subproblem is solved by a weighted median algorithm. To the best of our knowledge, sCD is the first algorithm for L1-NMF whose complexity scales with the number of nonzero entries in the data, making it efficient in handling large-scale, sparse data. We perform extensive numerical experiments on synthetic and real-world data to show the effectiveness of our new proposed model (wL1-NMF) and algorithm (sCD).
- Abstract(参考訳): 非負行列分解(NMF)は、非負行列である$X$を2つの非負因子の積である$WH$で近似し、$W$は$r$カラムを持ち、$H$は$r$行を持つ。
本稿では,L1-NMF法を誤差尺度(L1-NMF)として用いるNMFについて考察する。
最初の寄与は L1-NMF に対する NP-ハードネス証明であり、$r=1$ であっても、最小二乗を使用する標準 NMF とは対照的である。
第2の貢献は、L1-NMFがスパース入力行列の因子の疎度を強く強制し、解釈可能性を向上させることである。
しかし、もしデータが偽ゼロの影響を受ければ、スパース解が多すぎるとモデルが劣化する可能性がある。
第3のコントリビューションは、重み付きL1-NMF(wL1-NMF)と呼ばれるスパースデータのための、より一般的なL1-NMFモデルである。
第4のコントリビューションは、wL1-NMFに対する新しい座標降下(CD)アプローチであり、スパースCD(sparse CD)と呼ばれ、各サブプロブレムは重み付き中央値アルゴリズムによって解かれる。
我々の知る限り、SCDはL1-NMFのための最初のアルゴリズムであり、その複雑さはデータ中のゼロでないエントリの数とともにスケールし、大規模でスパースなデータを扱うのに効率的である。
提案するモデル(wL1-NMF)とアルゴリズム(sCD)の有効性を示すため,合成データと実世界のデータについて広範な数値実験を行った。
関連論文リスト
- A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.12938977698988]
Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T07:24:11Z) - DFedADMM: Dual Constraints Controlled Model Inconsistency for
Decentralized Federated Learning [52.83811558753284]
分散学習(DFL)は、中央サーバーを捨て、分散通信ネットワークを確立する。
既存のDFL手法は依然として、局所的な矛盾と局所的な過度なオーバーフィッティングという2つの大きな課題に悩まされている。
論文 参考訳(メタデータ) (2023-08-16T11:22:36Z) - Log-based Sparse Nonnegative Matrix Factorization for Data
Representation [55.72494900138061]
非負の行列因子化(NMF)は、非負のデータを部品ベースの表現で表すことの有効性から、近年広く研究されている。
そこで本研究では,係数行列に対数ノルムを課した新しいNMF法を提案する。
提案手法のロバスト性を高めるために,$ell_2,log$-(pseudo) ノルムを新たに提案した。
論文 参考訳(メタデータ) (2022-04-22T11:38:10Z) - An Entropy Weighted Nonnegative Matrix Factorization Algorithm for
Feature Representation [6.156004893556576]
エントロピー重み付きNMF(EWNMF)と呼ばれる新しいタイプのNMFを提案する。
EWNMFは各データポイントの属性ごとに最適化可能な重みを使い、その重要性を強調する。
いくつかのデータセットによる実験結果から,提案手法の有効性と有効性を示した。
論文 参考訳(メタデータ) (2021-11-27T23:37:20Z) - Structured Sparse Non-negative Matrix Factorization with L20-Norm for
scRNA-seq Data Analysis [10.628932392896374]
クラスタリング性能を向上させるために,$ell_2,0$-norm 制約 (ONMF_$ell_20$) を持つ行 NMF を導入する。
マトリクスMF_$ell_20$を一連のペナル化データセットに変換して解く効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-27T13:31:41Z) - Entropy Minimizing Matrix Factorization [102.26446204624885]
NMF(Nonnegative Matrix Factorization)は、広く使用されているデータ分析技術であり、多くの実際のタスクで印象的な結果をもたらしました。
本研究では,上述の問題に対処するために,EMMF (Entropy Minimizing Matrix Factorization framework) を開発した。
通常、外れ値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立される。
論文 参考訳(メタデータ) (2021-03-24T21:08:43Z) - Self-supervised Symmetric Nonnegative Matrix Factorization [82.59905231819685]
シンメトリー非負係数行列(SNMF)は、データクラスタリングの強力な方法であることを示した。
より良いクラスタリング結果を求めるアンサンブルクラスタリングにインスパイアされた,自己監視型SNMF(S$3$NMF)を提案する。
SNMFのコード特性に対する感度を、追加情報に頼らずに活用しています。
論文 参考訳(メタデータ) (2021-03-02T12:47:40Z) - Algorithms for Nonnegative Matrix Factorization with the
Kullback-Leibler Divergence [20.671178429005973]
Kullback-Leibler (KL) の発散は、非負行列分解(NMF)の最も広く使われている目的関数の1つである。
目的関数の非増加を保証する3つの新しいアルゴリズムを提案する。
我々は、KL NMFアルゴリズムの性能に関する総合的な画像を提供するために、広範な数値実験を行う。
論文 参考訳(メタデータ) (2020-10-05T11:51:39Z) - Sparse Separable Nonnegative Matrix Factorization [22.679160149512377]
非負行列分解(NMF)の新しい変種を提案する。
分離性は、第1NMF因子の列が入力行列の列に等しいのに対して、スパース性は第2NMF因子の列がスパースであることが要求される。
雑音のない環境では、軽微な仮定の下で、我々のアルゴリズムが真に根底にある情報源を復元することを証明する。
論文 参考訳(メタデータ) (2020-06-13T03:52:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。