論文の概要: Data-Efficient and Interpretable Tabular Anomaly Detection
- arxiv url: http://arxiv.org/abs/2203.02034v2
- Date: Sun, 4 Jun 2023 22:42:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 05:42:24.555550
- Title: Data-Efficient and Interpretable Tabular Anomaly Detection
- Title(参考訳): データ効率と解釈可能な表状異常検出
- Authors: Chun-Hao Chang, Jinsung Yoon, Sercan Arik, Madeleine Udell, Tomas
Pfister
- Abstract要約: 本稿では,ホワイトボックスモデルクラスである一般化付加モデルを適用し,異常を検出する新しいフレームワークを提案する。
さらに、提案フレームワークであるDIADは、ラベル付きデータの少量を組み込んで、半教師付き設定における異常検出性能をさらに向上させることができる。
- 参考スコア(独自算出の注目度): 54.15249463477813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection (AD) plays an important role in numerous applications. We
focus on two understudied aspects of AD that are critical for integration into
real-world applications. First, most AD methods cannot incorporate labeled data
that are often available in practice in small quantities and can be crucial to
achieve high AD accuracy. Second, most AD methods are not interpretable, a
bottleneck that prevents stakeholders from understanding the reason behind the
anomalies. In this paper, we propose a novel AD framework that adapts a
white-box model class, Generalized Additive Models, to detect anomalies using a
partial identification objective which naturally handles noisy or heterogeneous
features. In addition, the proposed framework, DIAD, can incorporate a small
amount of labeled data to further boost anomaly detection performances in
semi-supervised settings. We demonstrate the superiority of our framework
compared to previous work in both unsupervised and semi-supervised settings
using diverse tabular datasets. For example, under 5 labeled anomalies DIAD
improves from 86.2\% to 89.4\% AUC by learning AD from unlabeled data. We also
present insightful interpretations that explain why DIAD deems certain samples
as anomalies.
- Abstract(参考訳): 異常検出(AD)は多くのアプリケーションにおいて重要な役割を果たす。
私たちは、現実のアプリケーションに統合するために重要なADの2つの未調査の側面に焦点を当てます。
第一に、ほとんどのADメソッドはラベル付きデータを組み込むことができないが、これは実際に少量で利用可能であり、高いAD精度を達成するために不可欠である。
第二に、ほとんどの広告メソッドは解釈不可能であり、ステークホルダーが異常の背後にある理由を理解するのを妨げるボトルネックである。
本稿では,ホワイトボックスモデルクラスである一般化加法モデルを適用し,ノイズや不均質な特徴を自然に処理する部分識別目的を用いて異常を検出する新しいアドフレームワークを提案する。
さらに、提案フレームワークであるDIADは、ラベル付きデータの少量を組み込んで、半教師付き設定における異常検出性能をさらに向上させることができる。
各種表付きデータセットを用いた教師なし設定と半教師なし設定の両方において、これまでの作業と比較して、我々のフレームワークの優位性を示す。
例えば、5以下のラベル付き異常DIADは、ラベルなしデータからADを学習することで86.2\%から89.4\%に改善される。
また、diadが特定のサンプルを異常と考える理由を説明する洞察的な解釈も提示する。
関連論文リスト
- Towards Within-Class Variation in Alzheimer's Disease Detection from Spontaneous Speech [60.08015780474457]
アルツハイマー病(AD)の検出は、機械学習の分類モデルを使用する有望な研究領域として浮上している。
我々は、AD検出において、クラス内変異が重要な課題であると考え、ADを持つ個人は認知障害のスペクトルを示す。
本稿では,ソフトターゲット蒸留 (SoTD) とインスタンスレベルの再分散 (InRe) の2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T02:06:05Z) - Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。
この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。
セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文 参考訳(メタデータ) (2024-04-16T17:38:26Z) - Weakly Supervised Anomaly Detection via Knowledge-Data Alignment [24.125871437370357]
マルウェア検出、マネーロンダリング、デバイス障害検出、ネットワーク障害解析など、多数のWebベースのアプリケーションにおいて、異常検出が重要な役割を果たす。
Weakly Supervised Anomaly Detection (WSAD) が導入された。
本稿では,ルール知識を統合するための知識データアライメント(KDAlign)について紹介する。
論文 参考訳(メタデータ) (2024-02-06T07:57:13Z) - UADB: Unsupervised Anomaly Detection Booster [29.831918685340433]
教師なし異常検出(Unsupervised Anomaly Detection, UAD)は、その広範囲な実世界の応用のために重要なデータマイニング問題である。
そのような複雑さを記述できる仮定はひとつもなく、すべてのシナリオで有効である。
我々は、異なるデータに適応可能な任意のUADモデルに権限を与える一般的なUADブースタ(UADB)を提案する。
論文 参考訳(メタデータ) (2023-06-03T04:16:31Z) - Zero-Shot Anomaly Detection via Batch Normalization [58.291409630995744]
多くの安全クリティカルなアプリケーションドメインでは、異常検出が重要な役割を果たす。
異常検出器を正常なデータ分布でドリフトに適応させることの課題は、ゼロショットAD技術の開発に繋がった。
ゼロショットバッチレベルのADに対して,適応中心表現(Adaptive Centered Representation, ACR)と呼ばれるシンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-02-15T18:34:15Z) - Weakly Supervised Anomaly Detection: A Survey [75.26180038443462]
異常検出(AD)は、さまざまなアプリケーションによる機械学習において重要なタスクである。
弱教師付き異常検出法(WSAD)の総合的な調査を行った。
各設定に対して、正式な定義、鍵アルゴリズム、潜在的な将来の方向性を提供する。
論文 参考訳(メタデータ) (2023-02-09T10:27:21Z) - Deep Anomaly Detection and Search via Reinforcement Learning [22.005663849044772]
本研究では,エクスプロイトと探索のバランスをとるために,DADS(Deep Anomaly Detection and Search)を提案する。
トレーニングプロセス中、DADSは階層的なデータセットを持つ可能性のある異常を検索する。
その結果,DADSはラベルのないデータから異常を効率よく正確に検索し,そこから学習できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T13:03:33Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。