論文の概要: Entropy Minimizing Matrix Factorization
- arxiv url: http://arxiv.org/abs/2103.13487v1
- Date: Wed, 24 Mar 2021 21:08:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-26 13:24:24.361834
- Title: Entropy Minimizing Matrix Factorization
- Title(参考訳): エントロピー最小化行列分解
- Authors: Mulin Chen and Xuelong Li
- Abstract要約: NMF(Nonnegative Matrix Factorization)は、広く使用されているデータ分析技術であり、多くの実際のタスクで印象的な結果をもたらしました。
本研究では,上述の問題に対処するために,EMMF (Entropy Minimizing Matrix Factorization framework) を開発した。
通常、外れ値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立される。
- 参考スコア(独自算出の注目度): 102.26446204624885
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Nonnegative Matrix Factorization (NMF) is a widely-used data analysis
technique, and has yielded impressive results in many real-world tasks.
Generally, existing NMF methods represent each sample with several centroids,
and find the optimal centroids by minimizing the sum of the approximation
errors. However, the outliers deviating from the normal data distribution may
have large residues, and then dominate the objective value seriously. In this
study, an Entropy Minimizing Matrix Factorization framework (EMMF) is developed
to tackle the above problem. Considering that the outliers are usually much
less than the normal samples, a new entropy loss function is established for
matrix factorization, which minimizes the entropy of the residue distribution
and allows a few samples to have large approximation errors. In this way, the
outliers do not affect the approximation of the normal samples. The
multiplicative updating rules for EMMF are also designed, and the convergence
is proved both theoretically and experimentally. In addition, a Graph
regularized version of EMMF (G-EMMF) is also presented to deal with the complex
data structure. Clustering results on various synthetic and real-world datasets
demonstrate the reasonableness of the proposed models, and the effectiveness is
also verified through the comparison with the state-of-the-arts.
- Abstract(参考訳): 非負行列因子化(NMF)は、広く使われているデータ解析手法であり、多くの実世界のタスクにおいて印象的な結果をもたらした。
一般に、既存のNMF法は、各試料を複数のセントロイドで表現し、近似誤差の和を最小化して最適なセントロイドを求める。
しかし、通常のデータ分布から逸脱する外れ値には大きな残基があり、目的値が真に支配される。
本研究では,この問題に対処するために,エントロピー最小化行列因子化フレームワーク(EMMF)を開発した。
異常値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立され、残余分布のエントロピーが最小化され、少数のサンプルが近似誤差が大きい。
このようにして、外れ値が通常のサンプルの近似に影響を与えない。
EMMFの乗法的更新ルールも設計され、理論的および実験的に収束が証明される。
さらに、複雑なデータ構造を扱うために、EMMF(G-EMMF)のグラフ正規化バージョンも提示される。
様々な合成データと実世界のデータセット上でのクラスタリングの結果から,提案モデルの妥当性が示され,最新データとの比較により有効性が検証された。
関連論文リスト
- Towards a Fairer Non-negative Matrix Factorization [6.069820038869034]
非負行列因子化(NMF)がデータ群の表現に偏りをもたらすかを検討する。
異なるグループに対する最大再構成損失を最小化するFairer-NMFという手法を提案する。
論文 参考訳(メタデータ) (2024-11-14T23:34:38Z) - Entrywise error bounds for low-rank approximations of kernel matrices [55.524284152242096]
切り抜き固有分解を用いて得られたカーネル行列の低ランク近似に対するエントリーワイド誤差境界を導出する。
重要な技術的革新は、小さな固有値に対応するカーネル行列の固有ベクトルの非局在化結果である。
我々は、合成および実世界のデータセットの集合に関する実証的研究により、我々の理論を検証した。
論文 参考訳(メタデータ) (2024-05-23T12:26:25Z) - Contaminated Images Recovery by Implementing Non-negative Matrix
Factorisation [0.0]
我々は,従来のNMF,HCNMF,L2,1-NMFアルゴリズムのロバスト性を理論的に検討し,ORLおよび拡張YaleBデータセットのロバスト性を示す実験セットを実行する。
これらの手法の計算コストのため、HCNMFやL2,1-NMFモデルのような最終モデルは、この研究のパラメータに収束しない。
論文 参考訳(メタデータ) (2022-11-08T13:50:27Z) - Learning Graphical Factor Models with Riemannian Optimization [70.13748170371889]
本稿では,低ランク構造制約下でのグラフ学習のためのフレキシブルなアルゴリズムフレームワークを提案する。
この問題は楕円分布のペナルティ化された最大推定値として表される。
楕円モデルによく適合する正定行列と定ランクの正半定行列のジオメトリを利用する。
論文 参考訳(メタデータ) (2022-10-21T13:19:45Z) - Unitary Approximate Message Passing for Matrix Factorization [90.84906091118084]
行列分解 (MF) を一定の制約で考慮し, 様々な分野の応用を見いだす。
我々は,効率の良いメッセージパッシング実装であるUAMPMFを用いて,MFに対するベイズ的アプローチを開発する。
UAMPMFは、回復精度、ロバスト性、計算複雑性の観点から、最先端のアルゴリズムを著しく上回ることを示す。
論文 参考訳(メタデータ) (2022-07-31T12:09:32Z) - Log-based Sparse Nonnegative Matrix Factorization for Data
Representation [55.72494900138061]
非負の行列因子化(NMF)は、非負のデータを部品ベースの表現で表すことの有効性から、近年広く研究されている。
そこで本研究では,係数行列に対数ノルムを課した新しいNMF法を提案する。
提案手法のロバスト性を高めるために,$ell_2,log$-(pseudo) ノルムを新たに提案した。
論文 参考訳(メタデータ) (2022-04-22T11:38:10Z) - Sampling Approximately Low-Rank Ising Models: MCMC meets Variational
Methods [35.24886589614034]
一般相互作用が$J$である超キューブ上の二次定値イジングモデルを考える。
我々の一般的な結果は、低ランクのIsingモデルに対する最初のサンプリングアルゴリズムを示唆している。
論文 参考訳(メタデータ) (2022-02-17T21:43:50Z) - Data embedding and prediction by sparse tropical matrix factorization [0.0]
本研究では,sparse tropical matrix factorization (stmf) という手法を提案する。
その結果, STMF近似は非負行列分解よりも高い相関性が得られることがわかった。
STMFは、スパースデータにトロピカルセミリングを使用する最初の作品です。
論文 参考訳(メタデータ) (2020-12-09T18:09:17Z) - Understanding Implicit Regularization in Over-Parameterized Single Index
Model [55.41685740015095]
我々は高次元単一インデックスモデルのための正規化自由アルゴリズムを設計する。
暗黙正則化現象の理論的保証を提供する。
論文 参考訳(メタデータ) (2020-07-16T13:27:47Z) - Efficient MCMC Sampling for Bayesian Matrix Factorization by Breaking
Posterior Symmetries [1.3858051019755282]
本稿では、これらの対称性を確実に破り、精度を維持/改善する事前選択に対する簡単な修正を提案する。
非ゼロ線形独立先行手段を用いることで,MCMC試料の自己相関が著しく低下し,再建誤差の低減につながる可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-08T00:25:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。