論文の概要: SORTAD: Self-Supervised Optimized Random Transformations for Anomaly
Detection in Tabular Data
- arxiv url: http://arxiv.org/abs/2311.11018v1
- Date: Sat, 18 Nov 2023 09:15:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 12:57:39.356852
- Title: SORTAD: Self-Supervised Optimized Random Transformations for Anomaly
Detection in Tabular Data
- Title(参考訳): SORTAD: タブラルデータにおける異常検出のための自己教師付き最適化ランダム変換
- Authors: Guy Hay and Pablo Liberman
- Abstract要約: SORTADは、分類プロセスに役立つランダム変換を最適に選択する新しいアルゴリズムである。
SORTADは複数の一般的な異常検出データセットに対して最先端の結果を得た。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a self-supervised approach to anomaly detection in tabular data.
Random transformations are applied to the data, and then each transformation is
identified based on its output. These predicted transformations are used to
identify anomalies. In tabular data this approach faces many challenges that
are related to the uncorrelated nature of the data. These challenges affect the
transformations that should be used, as well as the use of their predictions.
To this end, we propose SORTAD, a novel algorithm that is tailor-made to solve
these challenges. SORTAD optimally chooses random transformations that help the
classification process, and have a scoring function that is more sensitive to
the changes in the transformations classification prediction encountered in
tabular data. SORTAD achieved state-of-the-art results on multiple commonly
used anomaly detection data sets, as well as in the overall results across all
data sets tested.
- Abstract(参考訳): 表データにおける異常検出に対する自己教師ありアプローチを考える。
ランダム変換はデータに適用され、各変換はその出力に基づいて識別される。
これらの予測変換は異常を識別するために使われる。
表データでは、このアプローチはデータの非相関性に関連する多くの課題に直面します。
これらの課題は、使用するべき変換や、予測の使用に影響を与える。
そこで本研究では,これらの課題を解決するためのアルゴリズムSORTADを提案する。
SORTADは、分類プロセスに役立つランダム変換を最適に選択し、表データで遭遇する変換分類予測の変化により敏感なスコア関数を持つ。
SORTADは、テストされたすべてのデータセット全体と同様に、複数の一般的な異常検出データセットに対して最先端の結果を得た。
関連論文リスト
- Challenging Gradient Boosted Decision Trees with Tabular Transformers for Fraud Detection at Booking.com [1.6702285371066043]
自己監視学習(SSL)によって強化されたトランスフォーマーベースのニューラルネットワークは、さまざまなドメインで前例のないパフォーマンスを示している。
本稿では,電子商取引における典型的な課題である不正検出において,表型変換器を用いたGBDTに挑戦することを目的とする。
我々の手法はトランスフォーマーの能力を利用して、SSLを使ってすべての利用可能なデータを使って転送可能な表現を学習する。
提案手法は、平均精度(AP)スコアのかなりのマージンで、調整されたGBDTよりも優れている。
論文 参考訳(メタデータ) (2024-05-22T14:38:48Z) - Binary Quantification and Dataset Shift: An Experimental Investigation [54.14283123210872]
量子化は教師付き学習タスクであり、未学習データの集合のクラス有病率の予測器を訓練する。
定量化と他のタイプのデータセットシフトの関係は、いまだ大きく、未調査のままである。
本稿では,これらのシフトに影響を受けるデータセットの生成プロトコルを確立することにより,データセットシフトの種類を詳細に分類する手法を提案する。
論文 参考訳(メタデータ) (2023-10-06T20:11:27Z) - Beyond Individual Input for Deep Anomaly Detection on Tabular Data [0.0]
異常検出は、金融、医療、サイバーセキュリティなど、多くの領域において不可欠である。
私たちの知る限りでは、この機能機能とサンプルサンプル依存関係をうまく組み合わせる最初の作業です。
提案手法は,F1スコアとAUROCをそれぞれ2.4%,AUROCを1.2%上回り,最先端性能を実現している。
論文 参考訳(メタデータ) (2023-05-24T13:13:26Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Generating Data to Mitigate Spurious Correlations in Natural Language
Inference Datasets [27.562256973255728]
自然言語処理モデルはしばしば、タスクに依存しない特徴とデータセットのラベルの間の急激な相関を利用して、トレーニング対象のディストリビューション内でのみうまく機能する。
そこで本研究では, 脱バイアス化したデータセットを生成して, 脱バイアス化したオフザシェルフモデルをトレーニングする手法を提案する。
提案手法は,1)高品質なラベル一貫性のあるデータサンプルを生成するためのデータジェネレータの訓練方法,2)素粒子相関に寄与するデータ点を除去するフィルタリング機構から構成される。
論文 参考訳(メタデータ) (2022-03-24T09:08:05Z) - SLA$^2$P: Self-supervised Anomaly Detection with Adversarial
Perturbation [77.71161225100927]
異常検出は、機械学習の基本的な問題であるが、難しい問題である。
本稿では,非教師付き異常検出のための新しい強力なフレームワークであるSLA$2$Pを提案する。
論文 参考訳(メタデータ) (2021-11-25T03:53:43Z) - Tail-to-Tail Non-Autoregressive Sequence Prediction for Chinese
Grammatical Error Correction [49.25830718574892]
本稿では,Tail-to-Tail (textbfTtT) という新しいフレームワークを提案する。
ほとんどのトークンが正しいので、ソースからターゲットに直接転送でき、エラー位置を推定して修正することができる。
標準データセット、特に可変長データセットに関する実験結果は、文レベルの精度、精度、リコール、F1-Measureの観点からTtTの有効性を示す。
論文 参考訳(メタデータ) (2021-06-03T05:56:57Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - Transforming variables to central normality [0.0]
変数をより正常にするためには、変数を前処理するのが慣例である。
Box-Cox と Yeo-Johnson 変換は、このためによく知られたツールである。
本稿では、これらの変換の修正と、オフ値に対して頑健な変換パラメータの推定手法を提案する。
論文 参考訳(メタデータ) (2020-05-16T10:50:42Z) - Classification-Based Anomaly Detection for General Data [37.31168012111834]
我々は統一的な視点を示し、現在の仮定を緩和するオープンセット手法であるGOADを提案する。
我々は、ランダムアフィン変換を用いた非画像データへの変換に基づく手法の適用性を拡張する。
提案手法は最先端の精度を示し, 広範データ型に適用可能である。
論文 参考訳(メタデータ) (2020-05-05T17:44:40Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。