論文の概要: Outlier Detection Using a Novel method: Quantum Clustering
- arxiv url: http://arxiv.org/abs/2006.04760v1
- Date: Mon, 8 Jun 2020 17:19:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 00:05:46.778037
- Title: Outlier Detection Using a Novel method: Quantum Clustering
- Title(参考訳): 量子クラスタリングを用いた異常検出
- Authors: Ding Liu, Hui Li
- Abstract要約: 通常のデータインスタンスは、データ密度の変動がほとんどない領域に常駐する。
我々は、教師なし外乱検出に新しい密度に基づくアプローチを適用した。
- 参考スコア(独自算出の注目度): 24.11904406960212
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a new assumption in outlier detection: Normal data instances are
commonly located in the area that there is hardly any fluctuation on data
density, while outliers are often appeared in the area that there is violent
fluctuation on data density. And based on this hypothesis, we apply a novel
density-based approach to unsupervised outlier detection. This approach, called
Quantum Clustering (QC), deals with unlabeled data processing and constructs a
potential function to find the centroids of clusters and the outliers. The
experiments show that the potential function could clearly find the hidden
outliers in data points effectively. Besides, by using QC, we could find more
subtle outliers by adjusting the parameter $\sigma$. Moreover, our approach is
also evaluated on two datasets (Air Quality Detection and Darwin Correspondence
Project) from two different research areas, and the results show the wide
applicability of our method.
- Abstract(参考訳): 通常のデータインスタンスは、データ密度の変動がほとんどない領域に置かれることが多いが、データ密度に激しい変動がある領域には、異常値がしばしば現れる。
この仮説に基づいて、教師なし外乱検出に新しい密度に基づくアプローチを適用する。
このアプローチは量子クラスタリング(Quantum Clustering, QC)と呼ばれ、ラベルのないデータ処理を扱い、クラスタのセントロイドとアウトリーチを見つける潜在的な関数を構築する。
実験によれば、ポテンシャル関数はデータポイントの隠れた外れ値を効果的に見つけることができる。
さらに、QCを使用することでパラメータを$\sigma$に調整することで、より微妙な外れ値を見つけることができる。
また,2つの異なる研究領域から得られた2つのデータセット(空気品質検出とdarwin対応プロジェクト)について評価し,本手法の幅広い適用性を示す。
関連論文リスト
- Research on Dynamic Data Flow Anomaly Detection based on Machine Learning [11.526496773281938]
本研究では,非教師なし学習法を用いて動的データフローの異常を同定する。
類似したデータをクラスタリングすることで、ラベル付きデータを必要とせずに、通常のトラフィックから著しく逸脱するデータ挙動を検出することができる。
特に、不均衡なデータのコンテキストにおいて、堅牢で適応可能なパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-09-23T08:19:15Z) - Anomaly Detection by Context Contrasting [57.695202846009714]
異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型学習の進歩は、この点において大きな可能性を秘めている。
我々はコンテキスト拡張を通じて学習するCon$を提案する。
論文 参考訳(メタデータ) (2024-05-29T07:59:06Z) - HLoOP -- Hyperbolic 2-space Local Outlier Probabilities [4.030910640265943]
本稿では,双曲型2次元空間に接地したデータセットに対して,局所的な外れ値を検出するための簡単なフレームワークを提案する。
開発されたHLoOPは、密度に基づく外れ値スコアリングと確率論的、統計的指向のアプローチを組み合わせたものである。
HLoOPアルゴリズムはWordNetデータセット上でテストされ、有望な結果が得られる。
論文 参考訳(メタデータ) (2023-12-06T20:38:39Z) - Beyond Labels: Advancing Cluster Analysis with the Entropy of Distance
Distribution (EDD) [0.0]
距離分布のエントロピー(Entropy of Distance Distribution、EDD)は、ラベルフリークラスタリング分析におけるパラダイムシフトである。
本手法ではシャノン情報エントロピーを用いて,データセット内の距離分布の「ピーク性」や「平坦性」を定量化する。
EDDのポテンシャルは、従来のクラスタリング分析を超えて、複雑なデータ構造を解き放つための堅牢でスケーラブルなツールを提供する。
論文 参考訳(メタデータ) (2023-11-28T09:22:17Z) - Binary Quantification and Dataset Shift: An Experimental Investigation [54.14283123210872]
量子化は教師付き学習タスクであり、未学習データの集合のクラス有病率の予測器を訓練する。
定量化と他のタイプのデータセットシフトの関係は、いまだ大きく、未調査のままである。
本稿では,これらのシフトに影響を受けるデータセットの生成プロトコルを確立することにより,データセットシフトの種類を詳細に分類する手法を提案する。
論文 参考訳(メタデータ) (2023-10-06T20:11:27Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-21T23:11:33Z) - Outlier detection in multivariate functional data through a contaminated
mixture model [0.0]
この研究は、センサーのアクティビティを高頻度で記録する産業環境での応用によって動機付けられている。
目的は、異常な測定行動を自動的に検出することである。
論文 参考訳(メタデータ) (2021-06-14T08:17:42Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - Am I Rare? An Intelligent Summarization Approach for Identifying Hidden
Anomalies [0.0]
本稿では,INSIDENTと呼ばれる隠れ異常を識別するインテリジェント・サマリゼーション手法を提案する。
提案手法は,各クラスタの特徴を局所重み付けすることにより,特徴空間を特徴空間に動的にマッピングするクラスタリングに基づくアルゴリズムである。
また、クラスタサイズに基づく代表者の選択は、集計データ内の元のデータと同じ分布を保持する。
論文 参考訳(メタデータ) (2020-12-24T23:22:57Z) - Classify and Generate Reciprocally: Simultaneous Positive-Unlabelled
Learning and Conditional Generation with Extra Data [77.31213472792088]
クラスラベルデータの不足は、多くの機械学習問題において、ユビキタスなボトルネックとなっている。
本稿では, 正負ラベル付き(PU)分類と, 余分なラベル付きデータによる条件生成を活用することで, この問題に対処する。
本稿では,PU分類と条件生成を併用した新たなトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-14T08:27:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。