論文の概要: McCatch: Scalable Microcluster Detection in Dimensional and
Nondimensional Datasets
- arxiv url: http://arxiv.org/abs/2403.08027v1
- Date: Tue, 12 Mar 2024 18:55:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 16:55:17.069771
- Title: McCatch: Scalable Microcluster Detection in Dimensional and
Nondimensional Datasets
- Title(参考訳): McCatch: 次元と空間におけるスケーラブルなマイクロクラスタ検出
非次元データセット
- Authors: Braulio V. S\'anchez Vinces, Robson L. F. Cordeiro, Christos Faloutsos
- Abstract要約: 本稿では,提案した Oracle プロットを利用してマイクロクラスタを検出するアルゴリズムである McCatch を提案する。
我々は、最大100万のデータ要素を持つ31の実データと合成データセットを調査し、McMatchが上記の2つの疑問に答える唯一の方法であることを示す。
また、グラフ、指紋、ネットワーク接続ログ、テキストデータ、衛星画像などの意味のあるマイクロクラスタを検出できる、McMatchの機能についても紹介する。
- 参考スコア(独自算出の注目度): 13.727185703571546
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How could we have an outlier detector that works even with nondimensional
data, and ranks together both singleton microclusters ('one-off' outliers) and
nonsingleton microclusters by their anomaly scores? How to obtain scores that
are principled in one scalable and 'hands-off' manner? Microclusters of
outliers indicate coalition or repetition in fraud activities, etc.; their
identification is thus highly desirable. This paper presents McCatch: a new
algorithm that detects microclusters by leveraging our proposed 'Oracle' plot
(1NN Distance versus Group 1NN Distance). We study 31 real and synthetic
datasets with up to 1M data elements to show that McCatch is the only method
that answers both of the questions above; and, it outperforms 11 other methods,
especially when the data has nonsingleton microclusters or is nondimensional.
We also showcase McCatch's ability to detect meaningful microclusters in
graphs, fingerprints, logs of network connections, text data, and satellite
imagery. For example, it found a 30-elements microcluster of confirmed 'Denial
of Service' attacks in the network logs, taking only ~3 minutes for 222K data
elements on a stock desktop.
- Abstract(参考訳): 非次元データでも機能し、シングルトン・マイクロクラスター(「ワン・オフ・アウト・リアー」)と非シングルトン・マイクロクラスターの両方を異常スコアでランク付けするアウトリー検出器をどうやって作るのか?
スケーラブルで‘ハンズ・オフ’な方法で原則化されたスコアをどうやって得るか?
違反者のマイクロクラスタは、不正行為等における連帯または反復を意味する。
したがって、その識別は極めて望ましい。
本稿では、提案した「Oracle」プロット(グループ1NNディスタンス対グループ1NNディスタンス)を活用して、マイクロクラスタを検出する新しいアルゴリズムであるMcCatchを提案する。
我々は、最大100万個のデータ要素を持つ31個の実データおよび合成データセットを調査し、McMatchが上記の2つの疑問に答える唯一の方法であることを示し、特にデータが非シングルトンマイクロクラスタを持つ場合、特に非次元である場合、11個の他の手法より優れていることを示す。
また、グラフ、指紋、ネットワーク接続ログ、テキストデータ、衛星画像などの意味のあるマイクロクラスタを検出できる、McMatchの機能についても紹介する。
例えば、ネットワークログに確認された‘Denial of Service’攻撃の30要素のマイクロクラスタが見つかった。
関連論文リスト
- A Geometrical Approach to Evaluate the Adversarial Robustness of Deep
Neural Networks [52.09243852066406]
対向収束時間スコア(ACTS)は、対向ロバストネス指標として収束時間を測定する。
我々は,大規模画像Netデータセットに対する異なる敵攻撃に対して,提案したACTSメトリックの有効性と一般化を検証する。
論文 参考訳(メタデータ) (2023-10-10T09:39:38Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - D.MCA: Outlier Detection with Explicit Micro-Cluster Assignments [17.564273966899137]
我々はD.MCAを提案し、明示的に$underlineD$etectoutliersでoutliersを検出する。
メソッドは、検出と割り当てを反復的に、社内で実行します。
16の実世界のデータセットと合成データセットで実施された実験は、D.MCAが8つの最先端の競合より優れていることを示した。
論文 参考訳(メタデータ) (2022-10-15T06:59:04Z) - Label-Only Membership Inference Attack against Node-Level Graph Neural
Networks [30.137860266059004]
グラフニューラルネットワーク(GNN)は、メンバーシップ推論攻撃(MIA)に対して脆弱である
本稿では,GNNのフレキシブル予測機構を利用して,ノード分類のためのラベルのみのMIAを提案する。
攻撃手法は,ほとんどのデータセットやGNNモデルに対して,AUC(Area Under the Curve)の精度,精度,面積の約60%を達成している。
論文 参考訳(メタデータ) (2022-07-27T19:46:26Z) - Multi-instance Point Cloud Registration by Efficient Correspondence
Clustering [6.190693048667185]
既存のソリューションでは、可能なインスタンスを検出し、オフレイラを拒否するために、多くの仮説をサンプリングする必要がある。
距離不変行列に基づいて,雑音対応の集合を異なるクラスタにグループ化することを提案する。
その結果,F1スコアが90.46%で最大20のインスタンスを正しく登録できることがわかった。
論文 参考訳(メタデータ) (2021-11-29T15:13:29Z) - Meta Clustering Learning for Large-scale Unsupervised Person
Re-identification [124.54749810371986]
メタクラスタリング学習(MCL)と呼ばれる「大規模タスクのための小さなデータ」パラダイムを提案する。
MCLは、第1フェーズのトレーニングのためにコンピューティングを節約するためにクラスタリングを介して、未ラベルデータのサブセットを擬似ラベル付けするのみである。
提案手法は計算コストを大幅に削減すると同時に,従来よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2021-11-19T04:10:18Z) - Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。
RTKMは他の方法と競合することを示す。
論文 参考訳(メタデータ) (2021-08-16T15:49:40Z) - Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。
従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。
本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文 参考訳(メタデータ) (2021-05-22T10:17:38Z) - Object Detection Made Simpler by Eliminating Heuristic NMS [70.93004137521946]
単純なNMSのないエンドツーエンドのオブジェクト検出フレームワークを示す。
検出精度は元の1段検出器と比べて同等か、さらに向上した。
論文 参考訳(メタデータ) (2021-01-28T02:38:29Z) - Generalized Insider Attack Detection Implementation using NetFlow Data [0.6236743421605786]
ネットワークデータを用いて攻撃を識別する手法について検討する。
我々の研究は、One-Class SVMやbi-clusteringのような教師なしの機械学習技術に基づいています。
われわれのアプローチは、現実的な環境でインサイダー攻撃検出のための有望なツールであることを示す。
論文 参考訳(メタデータ) (2020-10-27T14:00:31Z) - A novel sentence embedding based topic detection method for micro-blog [5.821169298644354]
マイクロブログデータセットのトピックを検出するニューラルネットワークに基づく新しいアプローチを提案する。
ブログを埋め込み空間にマッピングするために、教師なしのニューラル文埋め込みモデルを使用します。
さらに,関係対応DBSCAN (RADBSCAN) と呼ばれる改良されたクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-10T09:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。