論文の概要: Outlier Detection and Data Clustering via Innovation Search
- arxiv url: http://arxiv.org/abs/1912.12988v1
- Date: Mon, 30 Dec 2019 16:29:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 02:24:32.491330
- Title: Outlier Detection and Data Clustering via Innovation Search
- Title(参考訳): イノベーションサーチによる外乱検出とデータクラスタリング
- Authors: Mostafa Rahmani and Ping Li
- Abstract要約: そこで本研究では,PCA法の設計にイノベーションの方向性を活用できることを新たに発見する。
提案手法はiSearchと呼ばれ、方向探索最適化問題を用いて各データポイントに対応する最適方向を算出する。
- 参考スコア(独自算出の注目度): 27.107601048639637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The idea of Innovation Search was proposed as a data clustering method in
which the directions of innovation were utilized to compute the adjacency
matrix and it was shown that Innovation Pursuit can notably outperform the self
representation based subspace clustering methods. In this paper, we present a
new discovery that the directions of innovation can be used to design a
provable and strong robust (to outlier) PCA method. The proposed approach,
dubbed iSearch, uses the direction search optimization problem to compute an
optimal direction corresponding to each data point. iSearch utilizes the
directions of innovation to measure the innovation of the data points and it
identifies the outliers as the most innovative data points. Analytical
performance guarantees are derived for the proposed robust PCA method under
different models for the distribution of the outliers including randomly
distributed outliers, clustered outliers, and linearly dependent outliers. In
addition, we study the problem of outlier detection in a union of subspaces and
it is shown that iSearch provably recovers the span of the inliers when the
inliers lie in a union of subspaces. Moreover, we present theoretical studies
which show that the proposed measure of innovation remains stable in the
presence of noise and the performance of iSearch is robust to noisy data. In
the challenging scenarios in which the outliers are close to each other or they
are close to the span of the inliers, iSearch is shown to remarkably outperform
most of the existing methods. The presented method shows that the directions of
innovation are useful representation of the data which can be used to perform
both data clustering and outlier detection.
- Abstract(参考訳): Innovation Searchのアイデアは,隣接行列の計算にイノベーションの方向性を利用するデータクラスタリング手法として提案され,Innovation Pursuitは自己表現に基づくサブスペースクラスタリング手法よりも優れていることが示された。
本稿では,イノベーションの方向性を,証明可能かつ強固な(外れ値)pca法の設計に応用できることを新たに発見する。
提案手法はiSearchと呼ばれ、方向探索最適化問題を用いて各データポイントに対応する最適方向を算出する。
isearchはイノベーションの方向を利用してデータポイントのイノベーションを計測し、外れ値を最も革新的なデータポイントとして識別する。
異なるモデルに基づくロバストpca法について,ランダム分布のアウトリアー,クラスタ分布のアウトリアー,線形依存のアウトリアーなどのアウトリアー分布について解析的性能保証を導出する。
さらに,サブスペースの和合体における外乱検出の問題について検討し,iSearchがサブスペースの和合体内にある場合,インレーヤの幅を確実に回復することを示した。
さらに,提案手法はノイズの存在下で安定であり,iSearchの性能はノイズの多いデータに対して堅牢であることを示す理論的研究を行った。
外れ値が互いに近かったり、外れ値の範囲に近かったりする難しいシナリオでは、isearchが既存のメソッドの大部分を著しく上回っていることが示される。
提案手法は,データクラスタリングと外乱検出の両方に使用可能なデータに対して,イノベーションの方向性が有用であることを示す。
関連論文リスト
- Study Features via Exploring Distribution Structure [9.596923373834093]
本稿では,データセットの確率的モデリングに基づく新しいデータ冗長性測定フレームワークと,ノイズに耐性のある新しい冗長性検出基準を提案する。
我々のフレームワークは柔軟性があり、異なるタイプの機能を扱うことができ、ベンチマークデータセットの実験では、メソッドの有効性が示されています。
論文 参考訳(メタデータ) (2024-01-15T09:01:31Z) - Diversified Outlier Exposure for Out-of-Distribution Detection via
Informative Extrapolation [110.34982764201689]
Out-of-Distribution(OOD)検出は、現実のアプリケーションに信頼性の高い機械学習モデルをデプロイするために重要である。
近年, 外部曝露によるOOD検出に有意な結果が得られた。
本稿では,補助外乱量に基づく情報外挿による効果的なOOD検出のための新しい枠組み,すなわちDivOE(Diversified Outlier Exposure)を提案する。
論文 参考訳(メタデータ) (2023-10-21T07:16:09Z) - STEERING: Stein Information Directed Exploration for Model-Based
Reinforcement Learning [111.75423966239092]
遷移モデルの現在の推定値と未知の最適値との間の積分確率距離(IPM)の観点から探索インセンティブを提案する。
KSDに基づく新しいアルゴリズムを開発した。 textbfSTEin information dirtextbfEcted Explor for model-based textbfReinforcement Learntextbfing。
論文 参考訳(メタデータ) (2023-01-28T00:49:28Z) - Hub-VAE: Unsupervised Hub-based Regularization of Variational
Autoencoders [11.252245456934348]
我々は、ハブベースの先行とハブベースのコントラスト損失を混合した非教師付きデータ駆動型潜在空間の正規化を提案する。
本アルゴリズムは,組込み空間におけるクラスタ分離性,高精度なデータ再構成と生成を実現する。
論文 参考訳(メタデータ) (2022-11-18T19:12:15Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Score matching enables causal discovery of nonlinear additive noise
models [63.93669924730725]
次世代のスケーラブル因果発見手法の設計方法について述べる。
本稿では,スコアのヤコビアンを効率的に近似し,因果グラフを復元する手法を提案する。
論文 参考訳(メタデータ) (2022-03-08T21:34:46Z) - Better Modelling Out-of-Distribution Regression on Distributed Acoustic
Sensor Data Using Anchored Hidden State Mixup [0.7455546102930911]
トレーニングデータとテストデータの統計的分布が異なる状況への機械学習モデルの応用を一般化することは、複雑な問題であった。
本稿では,正規化の新たなペナルティを形成するために,多様体隠蔽状態の混合と観測類似性を利用したアンカー型回帰混合アルゴリズムを提案する。
提案手法の既存手法に対する一般化性能を広範囲に評価し,提案手法が最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2022-02-23T03:12:21Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Closed-Form, Provable, and Robust PCA via Leverage Statistics and
Innovation Search [25.229137979402584]
本稿では,2次コスト関数の下で,Innovation Searchアルゴリズムによって計算されるイノベーション値について検討する。
新たなコスト関数を持つイノベーションバリューは,レバレッジスコアと同値であることが証明された。
この興味深い接続を利用して、Levanage ScoreベースのロバストPCA法に対するいくつかの理論的保証を確立する。
論文 参考訳(メタデータ) (2021-06-23T06:36:36Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Robust Locality-Aware Regression for Labeled Data Classification [5.432221650286726]
本稿では,ロバスト局所性認識回帰(RLAR)という特徴抽出フレームワークを提案する。
本モデルでは,クラス間の平均差を使わずに,適応的に境界表現学習を行うために再ターゲット回帰を導入する。
外れ値の乱れを緩和し、過度な適合を防止するため、L2,1ノルムによる正規化項とともに回帰項と局所性を考慮した項を計測する。
論文 参考訳(メタデータ) (2020-06-15T11:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。