論文の概要: Provable Noisy Sparse Subspace Clustering using Greedy Neighbor
Selection: A Coherence-Based Perspective
- arxiv url: http://arxiv.org/abs/2002.00401v1
- Date: Sun, 2 Feb 2020 14:28:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 19:46:47.252255
- Title: Provable Noisy Sparse Subspace Clustering using Greedy Neighbor
Selection: A Coherence-Based Perspective
- Title(参考訳): Greedy Neighbor Selection を用いた確率ノイズスパースサブスペースクラスタリング:コヒーレンスに基づく視点
- Authors: Jwo-Yuh Wu, Wen-Hsuan Li, Liang-Chi Huang, Yen-Ping Lin, Chun-Hung Liu
and Rung-Hung Gau
- Abstract要約: 我々は,MP/OMPを用いた適切な隣接同定を保証するためのコヒーレンスに基づく十分な条件を導出する。
驚くべき発見は、基底の真理部分空間が互いによく分離され、ノイズがそれほど大きくない場合、MPベースの繰り返しはアルゴリズムの複雑さが小さくなり、残余の摂動が小さくなることである。
- 参考スコア(独自算出の注目度): 18.888312436971187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sparse subspace clustering (SSC) using greedy-based neighbor selection, such
as matching pursuit (MP) and orthogonal matching pursuit (OMP), has been known
as a popular computationally-efficient alternative to the conventional
L1-minimization based methods. Under deterministic bounded noise corruption, in
this paper we derive coherence-based sufficient conditions guaranteeing correct
neighbor identification using MP/OMP. Our analyses exploit the maximum/minimum
inner product between two noisy data points subject to a known upper bound on
the noise level. The obtained sufficient condition clearly reveals the impact
of noise on greedy-based neighbor recovery. Specifically, it asserts that, as
long as noise is sufficiently small so that the resultant perturbed residual
vectors stay close to the desired subspace, both MP and OMP succeed in
returning a correct neighbor subset. A striking finding is that, when the
ground truth subspaces are well-separated from each other and noise is not
large, MP-based iterations, while enjoying lower algorithmic complexity, yield
smaller perturbation of residuals, thereby better able to identify correct
neighbors and, in turn, achieving higher global data clustering accuracy.
Extensive numerical experiments are used to corroborate our theoretical study.
- Abstract(参考訳): マッチング追尾 (MP) や直交マッチング追尾 (OMP) など, グリーディに基づく近傍選択を用いたスパース部分空間クラスタリング (SSC) は, 従来のL1最小化法に代わる計算効率のよい方法として広く知られている。
本稿では,MP/OMPを用いた近接同定の正当性を保証するために,コヒーレンスに基づく十分な条件を導出する。
本分析では,ノイズレベルの既知上界を受ける2つのノイズデータポイント間の内積の最大/最小値を利用する。
得られた十分な条件は, グリーディーベース近傍の回復に及ぼす騒音の影響を明らかにする。
具体的には、ノイズが十分小さい限り、結果として生じる摂動残差ベクトルが所望の部分空間に近づき続けるように、MPとOMPはともに正しい近傍部分集合を返すことに成功している。
驚くべき発見は、基底真理部分空間が互いにうまく分離され、ノイズが大きくない場合、mpベースの反復は、アルゴリズムの複雑さが低くなる一方で、残差の摂動が小さくなるため、より正確な隣人を識別でき、さらに高いグローバルデータクラスタリング精度が得られることである。
大規模な数値実験は、我々の理論研究の裏付けとなる。
関連論文リスト
- Adaptive $k$-nearest neighbor classifier based on the local estimation of the shape operator [49.87315310656657]
我々は, 局所曲率をサンプルで探索し, 周辺面積を適応的に定義する適応型$k$-nearest(kK$-NN)アルゴリズムを提案する。
多くの実世界のデータセットから、新しい$kK$-NNアルゴリズムは、確立された$k$-NN法と比較してバランスの取れた精度が優れていることが示されている。
論文 参考訳(メタデータ) (2024-09-08T13:08:45Z) - Sketches-based join size estimation under local differential privacy [3.0945730947183203]
機密データの結合サイズ推定は、プライバシー漏洩のリスクをもたらす。
ローカルディファレンシャルプライバシ(LDP)は、機密データを収集しながらプライバシを保存するソリューションである。
スケッチベースジョインサイズ推定のための LDPJoinSketch という新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-19T01:21:54Z) - DenMune: Density peak based clustering using mutual nearest neighbors [0.0]
多くのクラスタリングアルゴリズムは、クラスタが任意の形状、様々な密度、あるいはデータクラスが互いに不均衡で近接している場合に失敗する。
この課題を満たすために、新しいクラスタリングアルゴリズムであるDenMuneが提示されている。
これは、Kがユーザから要求される唯一のパラメータである大きさKの互いに近い近傍を用いて、密集領域を特定することに基づいている。
論文 参考訳(メタデータ) (2023-09-23T16:18:00Z) - Optimizing the Noise in Self-Supervised Learning: from Importance
Sampling to Noise-Contrastive Estimation [80.07065346699005]
GAN(Generative Adversarial Networks)のように、最適な雑音分布はデータ分布に等しくなると広く想定されている。
我々は、この自己教師型タスクをエネルギーベースモデルの推定問題として基礎づけるノイズ・コントラスト推定に目を向ける。
本研究は, 最適雑音のサンプリングは困難であり, 効率性の向上は, データに匹敵する雑音分布を選択することに比べ, 緩やかに行うことができると結論付けた。
論文 参考訳(メタデータ) (2023-01-23T19:57:58Z) - Multiple Kernel Clustering with Dual Noise Minimization [56.009011016367744]
マルチカーネルクラスタリング(MKC)は、ベースカーネルから補完的な情報を統合することでデータをグループ化する。
本稿では,双対雑音を厳密に定義し,パラメータフリーなMKCアルゴリズムを提案する。
二重ノイズはブロック対角構造を汚染し,クラスタリング性能の劣化を招き,CノイズはNノイズよりも強い破壊を示す。
論文 参考訳(メタデータ) (2022-07-13T08:37:42Z) - Greedier is Better: Selecting Multiple Neighbors per Iteration for
Sparse Subspace Clustering [18.888312436971187]
本稿では,一般化OMP(GOMP)を用いた新しいSSC方式を提案する。
GOMPはイテレーションが少ないため、アルゴリズムの複雑さが低い。
提案した停止規則は,部分空間次元と雑音パワーのオフライン推定が不要である。
論文 参考訳(メタデータ) (2022-04-06T04:20:35Z) - Multi-granularity Relabeled Under-sampling Algorithm for Imbalanced Data [15.030895782548576]
不均衡な分類問題は、データマイニングと機械学習において重要かつ困難な問題の1つであることが判明した。
Tomek-Linkサンプリングアルゴリズムは、データ上のクラスオーバーラップを効果的に低減し、識別が難しい多数インスタンスを除去し、アルゴリズムの分類精度を向上させる。
しかし、Tomek-Linksアンダーサンプリングアルゴリズムは、世界中に最も近い隣り合う境界インスタンスのみを考慮し、潜在的に局所的な重複するインスタンスを無視している。
本稿では,データセットの局所的情報を完全に考慮した多粒度アンダーサンプリングアルゴリズム(MGRU)を提案する。
論文 参考訳(メタデータ) (2022-01-11T14:07:55Z) - Non-Local Spatial Propagation Network for Depth Completion [82.60915972250706]
本研究では,深度完了のための堅牢で効率的な非局所的空間伝搬ネットワークを提案する。
提案するネットワークは,RGBとスパース深度画像を入力とし,各画素の非局所的近傍とその親和性を推定する。
提案アルゴリズムは,混合深度問題に対する深度補完精度とロバスト性の観点から,従来のアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:26:51Z) - Learning Halfspaces with Tsybakov Noise [50.659479930171585]
テュバコフ雑音の存在下でのハーフスペースの学習可能性について検討する。
真半空間に関して誤分類誤差$epsilon$を達成するアルゴリズムを与える。
論文 参考訳(メタデータ) (2020-06-11T14:25:02Z) - A Weighted Mutual k-Nearest Neighbour for Classification Mining [4.538870924201896]
kNNは非常に効果的なインスタンスベースの学習方法であり、実装が容易です。
本稿では,データセットから疑似近傍の異常検出と除去を行う新しい学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-14T18:11:30Z) - Residual-driven Fuzzy C-Means Clustering for Image Segmentation [152.609322951917]
画像分割のための残留駆動型ファジィC平均(FCM)について詳述する。
この枠組みに基づいて,混合雑音分布の重み付けによる重み付き$ell_2$-norm忠実度項を示す。
その結果、既存のFCM関連アルゴリズムよりも提案アルゴリズムの有効性と効率が優れていることが示された。
論文 参考訳(メタデータ) (2020-04-15T15:46:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。