論文の概要: C-AllOut: Catching & Calling Outliers by Type
- arxiv url: http://arxiv.org/abs/2110.08257v1
- Date: Wed, 13 Oct 2021 14:25:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-24 03:44:25.047449
- Title: C-AllOut: Catching & Calling Outliers by Type
- Title(参考訳): C-AllOut: キャッチ&コールアウトリアをタイプ別に
- Authors: Guilherme D. F. Silva, Leman Akoglu, Robson L. F. Cordeiro
- Abstract要約: C-AllOutは、型別に外れ値に注釈を付ける新しい外れ値検出器である。
パラメータフリーでスケーラブルであり、必要であればペアワイズな類似点(あるいは距離)でのみ動作する。
- 参考スコア(独自算出の注目度): 10.69970450827617
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Given an unlabeled dataset, wherein we have access only to pairwise
similarities (or distances), how can we effectively (1) detect outliers, and
(2) annotate/tag the outliers by type? Outlier detection has a large
literature, yet we find a key gap in the field: to our knowledge, no existing
work addresses the outlier annotation problem. Outliers are broadly classified
into 3 types, representing distinct patterns that could be valuable to
analysts: (a) global outliers are severe yet isolate cases that do not repeat,
e.g., a data collection error; (b) local outliers diverge from their peers
within a context, e.g., a particularly short basketball player; and (c)
collective outliers are isolated micro-clusters that may indicate coalition or
repetitions, e.g., frauds that exploit the same loophole. This paper presents
C-AllOut: a novel and effective outlier detector that annotates outliers by
type. It is parameter-free and scalable, besides working only with pairwise
similarities (or distances) when it is needed. We show that C-AllOut achieves
on par or significantly better performance than state-of-the-art detectors when
spotting outliers regardless of their type. It is also highly effective in
annotating outliers of particular types, a task that none of the baselines can
perform.
- Abstract(参考訳): ラベルのないデータセットが与えられた場合、ペアワイズな類似性(あるいは距離)のみにアクセスできる場合、(1)アウトリアーを効果的に検出し、(2)タイプ別にアノテート/タグを付けるには、どうすればよいのか?
outlier detectionには大きな文献がありますが、この分野には大きなギャップがあります: 私たちの知識では、既存の作業がoutlierアノテーションの問題に対処していません。
外れ値は3つのタイプに大まかに分類され、アナリストにとって価値のある異なるパターンを表している。
a) グローバルなアウトレイアは厳しいが、例えばデータ収集エラーを繰り返すことのない分離されたケースです。
(b)地域外れ者は、例えば、特に短いバスケットボール選手のように、文脈内で仲間から逸脱し、
c) 集団的異常者は分離されたマイクロクラスタであり、例えば同じ抜け穴を利用する詐欺など、連立または反復を示す可能性がある。
本稿では, 異常値のタイプ別アノテートを行う, 新規かつ効果的な異常値検出器であるc-alloutを提案する。
パラメータフリーでスケーラブルであり、必要であればペアワイズな類似点(あるいは距離)でのみ動作する。
我々は,C-AllOutが,その型に関係なく異常値を検出する場合に,最先端検出器よりも同等あるいははるかに優れた性能を示すことを示す。
また、どのベースラインも実行できないタスクである特定のタイプの外れ値のアノテートにも非常に効果的である。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - SSB: Simple but Strong Baseline for Boosting Performance of Open-Set
Semi-Supervised Learning [106.46648817126984]
本稿では,挑戦的で現実的なオープンセットSSL設定について検討する。
目標は、inlierを正しく分類し、outlierを検知することである。
信頼度の高い疑似ラベル付きデータを組み込むことで、不整合分類性能を大幅に改善できることが判明した。
論文 参考訳(メタデータ) (2023-11-17T15:14:40Z) - IOMatch: Simplifying Open-Set Semi-Supervised Learning with Joint
Inliers and Outliers Utilization [36.102831230805755]
多くの現実世界のアプリケーションでは、ラベル付けされていないデータは必然的に、ラベル付けされたクラスのどれにも属さない、目に見えないクラスの外れ値を含む。
我々は,新しいオープンセットSSLフレームワークであるIOMatchを紹介した。
論文 参考訳(メタデータ) (2023-08-25T04:14:02Z) - Robust Outlier Rejection for 3D Registration with Variational Bayes [70.98659381852787]
我々は、ロバストアライメントのための新しい変分非局所ネットワークベース外乱除去フレームワークを開発した。
そこで本稿では, 投票に基づく不整合探索手法を提案し, 変換推定のための高品質な仮説的不整合をクラスタリングする。
論文 参考訳(メタデータ) (2023-04-04T03:48:56Z) - ODIM: Outlier Detection via Likelihood of Under-Fitted Generative Models [4.956259629094216]
Unsupervised Outlier Detection (UOD) とは、非教師付き外乱検出(unsupervised outlier detection, UOD)問題である。
我々は、IM効果(ODIM)による外れ検知と呼ばれる新しい手法を開発した。
注目すべきなのは、ODIMはほんの数回の更新しか必要とせず、計算効率が他のディープラーニングベースのアルゴリズムの何倍も高速であることだ。
論文 参考訳(メタデータ) (2023-01-11T01:02:27Z) - Non-contrastive representation learning for intervals from well logs [58.70164460091879]
石油・ガス産業における表現学習問題は、ログデータに基づく表現を一定間隔で提供するモデルを構築することを目的としている。
可能なアプローチの1つは、自己教師付き学習(SSL)である。
私たちは、よくログするデータのための非コントラストSSLを最初に導入しました。
論文 参考訳(メタデータ) (2022-09-28T13:27:10Z) - Unsupervised Outlier Detection using Memory and Contrastive Learning [53.77693158251706]
特徴空間における外乱検出は,外乱検出から外乱検出までの特徴距離を測定することで行うことができると考えている。
本稿では,メモリモジュールとコントラスト学習モジュールを用いたMCODフレームワークを提案する。
提案したMCODは高い性能を達成し,9つの最先端手法より優れる。
論文 参考訳(メタデータ) (2021-07-27T07:35:42Z) - OpenMatch: Open-set Consistency Regularization for Semi-supervised
Learning with Outliers [71.08167292329028]
我々はOpenMatchと呼ばれる新しいオープンセットセミスーパーバイザードラーニング(OSSL)アプローチを提案する。
OpenMatchは、1-vs-all(OVA)分類器に基づいた新規検出とFixMatchを統合する。
3つのデータセットで最先端のパフォーマンスを実現し、CIFAR10の未ラベルデータで見えないアウトリーチを検出する上で、完全な教師付きモデルよりも優れています。
論文 参考訳(メタデータ) (2021-05-28T23:57:15Z) - Homophily Outlier Detection in Non-IID Categorical Data [43.51919113927003]
この研究は、新しい外れ値検出フレームワークとその2つのインスタンスを導入し、カテゴリデータの外れ値を特定する。
まず、分布に敏感な外部因子とその相互依存性を値値グラフベースの表現に定義し、組み込む。
学習した値の外れ度は、直接の外れ値検出または特徴選択の除外を可能にする。
論文 参考訳(メタデータ) (2021-03-21T23:29:33Z) - Benchmarking Unsupervised Outlier Detection with Realistic Synthetic
Data [0.0]
教師なしの異常検出のベンチマークは難しい。
このようなベンチマークのためのデータセットを生成するための汎用的なプロセスを提案する。
本稿では,特定の特性を持つアウトレーヤを生成するジェネリックプロセスの3つのインスタンス化について述べる。
論文 参考訳(メタデータ) (2020-04-15T08:55:47Z) - Finding Outliers in Gaussian Model-Based Clustering [1.0435741631709405]
クラスタリング(英: Clustering)または教師なし分類(英: unsupervised classification)は、しばしば外れ者によって悩まされるタスクである。
クラスタリングでは、アウトレーヤの処理には多くの作業があります。
論文 参考訳(メタデータ) (2019-07-02T03:02:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。