論文の概要: Retrieval Augmented Deep Anomaly Detection for Tabular Data
- arxiv url: http://arxiv.org/abs/2401.17052v2
- Date: Mon, 22 Jul 2024 06:23:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-24 02:50:43.591701
- Title: Retrieval Augmented Deep Anomaly Detection for Tabular Data
- Title(参考訳): 検索によるタブラリデータの深部異常検出
- Authors: Hugo Thimonier, Fabrice Popineau, Arpad Rimmel, Bich-Liên Doan,
- Abstract要約: 研究は、このギャップに対処するために、検索強化モデルを導入した。
本稿では,変圧器モデルを用いてテクスチャ正規サンプルのマスク特徴を再構成する再構成手法を提案する。
31データセットのベンチマークでの実験では、この再構成に基づく異常検出手法をサンプルサンプル依存で拡張することで、検索モジュールによるパフォーマンスが大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning for tabular data has garnered increasing attention in recent years, yet employing deep models for structured data remains challenging. While these models excel with unstructured data, their efficacy with structured data has been limited. Recent research has introduced retrieval-augmented models to address this gap, demonstrating promising results in supervised tasks such as classification and regression. In this work, we investigate using retrieval-augmented models for anomaly detection on tabular data. We propose a reconstruction-based approach in which a transformer model learns to reconstruct masked features of \textit{normal} samples. We test the effectiveness of KNN-based and attention-based modules to select relevant samples to help in the reconstruction process of the target sample. Our experiments on a benchmark of 31 tabular datasets reveal that augmenting this reconstruction-based anomaly detection (AD) method with sample-sample dependencies via retrieval modules significantly boosts performance. The present work supports the idea that retrieval module are useful to augment any deep AD method to enhance anomaly detection on tabular data.
- Abstract(参考訳): 近年,表形式のデータに対する深層学習が注目されているが,構造化データに対する深層モデルの採用は依然として困難である。
これらのモデルは非構造化データで優れているが、構造化データでの有効性は制限されている。
近年の研究では、このギャップに対処する検索強化モデルを導入し、分類や回帰といった教師付きタスクにおいて有望な結果を示した。
本研究では,検索拡張モデルを用いて表データの異常検出を行う。
本稿では,変圧器モデルを用いて<textit{normal} サンプルのマスク付き特徴を再構成する再構成手法を提案する。
対象サンプルの再構成プロセスにおいて,KNNおよび注目型モジュールの有効性を検証し,関連サンプルの選択に役立てる。
本研究は,31個の表付きデータセットのベンチマーク実験により,この再構成に基づく異常検出(AD)手法をサンプルサンプルに依存した検索モジュールで拡張することにより,性能が著しく向上することを示した。
本研究は,検索モジュールが深部AD法を拡張して表データの異常検出を強化するのに有用であるという考えを支持する。
関連論文リスト
- Measuring Feature Dependency of Neural Networks by Collapsing Feature Dimensions in the Data Manifold [18.64569268049846]
ニューラルネットワークモデルの特徴依存性を測定するための新しい手法を提案する。
その動機は、人間が理解可能な機能から情報を使っているかどうかを問うことによって、モデルをよりよく理解することにある。
本手法は,合成画像データに基づいて学習した深層ニューラルネットワークモデルを用いて実験を行った。
論文 参考訳(メタデータ) (2024-04-18T17:10:18Z) - TRIAGE: Characterizing and auditing training data for improved
regression [80.11415390605215]
TRIAGEは回帰タスクに適した新しいデータキャラクタリゼーションフレームワークで、広範囲の回帰器と互換性がある。
TRIAGEは、共形予測分布を利用して、モデルに依存しないスコアリング方法、TRIAGEスコアを提供する。
TRIAGEの特徴は一貫性があり、複数の回帰設定においてデータの彫刻/フィルタリングによるパフォーマンス向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-10-29T10:31:59Z) - Active anomaly detection based on deep one-class classification [9.904380236739398]
我々は,Deep SVDDにおけるアクティブラーニングの2つの重要な課題,すなわちクエリ戦略と半教師付きラーニング手法に対処する。
まず、単に異常を識別するのではなく、適応境界に従って不確実なサンプルを選択する。
第2に、ラベル付き正規データと異常データの両方を効果的に組み込むために、一級分類モデルの訓練にノイズコントラスト推定を適用した。
論文 参考訳(メタデータ) (2023-09-18T03:56:45Z) - Fascinating Supervisory Signals and Where to Find Them: Deep Anomaly
Detection with Scale Learning [11.245813423781415]
我々は、データラベルとして特性-スケール-を導入することで、データのための新しいデータ駆動監視を考案する。
スケールは変換された表現にアタッチされたラベルとして機能し、ニューラルネットワークのトレーニングに十分なラベル付きデータを提供する。
本稿では,大規模学習に基づく異常検出手法を提案する。
論文 参考訳(メタデータ) (2023-05-25T14:48:00Z) - Beyond Individual Input for Deep Anomaly Detection on Tabular Data [0.0]
異常検出は、金融、医療、サイバーセキュリティなど、多くの領域において不可欠である。
私たちの知る限りでは、この機能機能とサンプルサンプル依存関係をうまく組み合わせる最初の作業です。
提案手法は,F1スコアとAUROCをそれぞれ2.4%,AUROCを1.2%上回り,最先端性能を実現している。
論文 参考訳(メタデータ) (2023-05-24T13:13:26Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Watermarking for Out-of-distribution Detection [76.20630986010114]
Out-of-Distribution (OOD) 検出は、よく訓練された深層モデルから抽出された表現に基づいてOODデータを識別することを目的としている。
本稿では,透かしという一般的な手法を提案する。
我々は,元データの特徴に重畳される統一パターンを学習し,ウォーターマーキング後にモデルの検出能力が大きく向上する。
論文 参考訳(メタデータ) (2022-10-27T06:12:32Z) - Discovery of Governing Equations with Recursive Deep Neural Networks [5.031093893882574]
本稿では,データを時間内に効率的にサンプリングしない場合のモデル発見問題に焦点をあてる。
データ駆動モデル探索のための再帰ディープニューラルネットワーク(RDNN)を導入する。
提案手法は, 既存のデータを大量の時間ラグでサンプリングした場合に, 優れた性能を示す。
論文 参考訳(メタデータ) (2020-09-24T05:59:03Z) - Data from Model: Extracting Data from Non-robust and Robust Models [83.60161052867534]
この研究は、データとモデルの関係を明らかにするために、モデルからデータを生成する逆プロセスについて検討する。
本稿では,データ・トゥ・モデル(DtM)とデータ・トゥ・モデル(DfM)を連続的に処理し,特徴マッピング情報の喪失について検討する。
以上の結果から,DtMとDfMの複数シーケンスの後にも,特にロバストモデルにおいて精度低下が制限されることが示唆された。
論文 参考訳(メタデータ) (2020-07-13T05:27:48Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。