論文の概要: Tighten The Lasso: A Convex Hull Volume-based Anomaly Detection Method
- arxiv url: http://arxiv.org/abs/2502.18601v1
- Date: Tue, 25 Feb 2025 19:39:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-27 14:57:06.256026
- Title: Tighten The Lasso: A Convex Hull Volume-based Anomaly Detection Method
- Title(参考訳): Tighten The Lasso: Convex Hull Volume-based Anomaly Detection Method
- Authors: Uri Itai, Asael Bar Ilan, Teddy Lazebnik,
- Abstract要約: 本稿では,データセットの凸殻特性に基づく新しい異常検出アルゴリズムを提案する。
我々のアルゴリズムは、データセットからより多くのデータポイントが削除されるにつれてCHの体積を計算する。
計算的に安価で簡単なチェックにより、提案アルゴリズムに適したデータセットを検出できることを示す。
- 参考スコア(独自算出の注目度): 0.6144680854063939
- License:
- Abstract: The rapid advancements in data-driven methodologies have underscored the critical importance of ensuring data quality. Consequently, detecting out-of-distribution (OOD) data has emerged as an essential task to maintain the reliability and robustness of data-driven models, in general, and machine and deep learning models, in particular. In this study, we leveraged the convex hull property of a dataset and the fact that anomalies highly contribute to the increase of the CH's volume to propose a novel anomaly detection algorithm. Our algorithm computes the CH's volume as an increasing number of data points are removed from the dataset to define a decision line between OOD and in-distribution data points. We compared the proposed algorithm to seven widely used anomaly detection algorithms over ten datasets, showing comparable results for state-of-the-art (SOTA) algorithms. Moreover, we show that with a computationally cheap and simple check, one can detect datasets that are well-suited for the proposed algorithm which outperforms the SOTA anomaly detection algorithms.
- Abstract(参考訳): データ駆動手法の急速な進歩は、データ品質を保証することの重要性を浮き彫りにした。
その結果,データ駆動モデルの信頼性と堅牢性,特にマシンラーニングモデルとディープラーニングモデルの信頼性を維持する上で,OOD(out-of-distriion)データの検出が重要な課題となっている。
本研究では,データセットの凸殻特性と異常がCH量の増加に大きく寄与するという事実を活用し,新しい異常検出アルゴリズムを提案する。
提案アルゴリズムは,OODと分布内データポイント間の決定線を定義するためにデータセットからデータポイントの数が増加するにつれてCHの体積を計算する。
提案アルゴリズムを10個のデータセット上で広く使用されている7つの異常検出アルゴリズムと比較し、最先端(SOTA)アルゴリズムに匹敵する結果を示した。
さらに,計算的に安価で簡単なチェックにより,SOTA異常検出アルゴリズムより優れた提案アルゴリズムに適したデータセットを検出できることを示す。
関連論文リスト
- An Efficient Outlier Detection Algorithm for Data Streaming [51.56874851156008]
Local Outlier Factor (LOF)アルゴリズムのような従来の異常検出手法は、リアルタイムデータと競合する。
本稿では,オンライン異常検出におけるLOFアルゴリズムの効率向上のための新しい手法を提案し,EILOFアルゴリズムを提案する。
EILOFアルゴリズムは計算コストを大幅に削減するだけでなく、加算点数が増加すると検出精度を体系的に改善する。
論文 参考訳(メタデータ) (2025-01-02T05:12:43Z) - Unsupervised Anomaly Detection for Tabular Data Using Noise Evaluation [26.312206159418903]
教師なし異常検出(UAD)は、現代のデータ分析において重要な役割を果たす。
データに含まれるノイズの量を評価することによって,新しいUAD手法を提案する。
提案手法が異常データの検出に有効であることを証明し,理論的保証を提供する。
論文 参考訳(メタデータ) (2024-12-16T05:35:58Z) - DeepHYDRA: Resource-Efficient Time-Series Anomaly Detection in Dynamically-Configured Systems [3.44012349879073]
我々はDeepHYDRA(Deep Hybrid DBSCAN/reduction-based Anomaly Detection)を提案する。
DBSCANと学習ベースの異常検出を組み合わせる。
大規模なデータセットと複雑なデータセットの両方において、異なるタイプの異常を確実に検出できることが示されている。
論文 参考訳(メタデータ) (2024-05-13T13:47:15Z) - Bagged Regularized $k$-Distances for Anomaly Detection [9.899763598214122]
BRDAD (Bagged regularized $k$-distances for Anomaly Detection) と呼ばれる距離に基づく新しいアルゴリズムを提案する。
我々のBRDADアルゴリズムは、重み付けされた密度推定のための$k$-distances(BWDDE)の実証的リスクの有限標本境界を最小化して重みを選択する。
理論的には,我々のアルゴリズムに対するAUCの高速収束率を確立し,バッグング手法が計算複雑性を著しく減少させることを示す。
論文 参考訳(メタデータ) (2023-12-02T07:00:46Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Framing Algorithmic Recourse for Anomaly Detection [18.347886926848563]
我々は,タブラルデータ(CARAT)における異常に対する文脈保存型アルゴリズムレコースを提案する。
CARATはトランスフォーマーベースのエンコーダデコーダモデルを用いて、低い確率で特徴を見つけることで異常を説明する。
異常なインスタンス内の特徴の全体的コンテキストを使用して、強調された特徴を変更することによって、意味的に一貫性のある反事実が生成される。
論文 参考訳(メタデータ) (2022-06-29T03:30:51Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Am I Rare? An Intelligent Summarization Approach for Identifying Hidden
Anomalies [0.0]
本稿では,INSIDENTと呼ばれる隠れ異常を識別するインテリジェント・サマリゼーション手法を提案する。
提案手法は,各クラスタの特徴を局所重み付けすることにより,特徴空間を特徴空間に動的にマッピングするクラスタリングに基づくアルゴリズムである。
また、クラスタサイズに基づく代表者の選択は、集計データ内の元のデータと同じ分布を保持する。
論文 参考訳(メタデータ) (2020-12-24T23:22:57Z) - Stochastic Hard Thresholding Algorithms for AUC Maximization [49.00683387735522]
分散分類におけるAUCのためのハードしきい値決定アルゴリズムを開発した。
提案アルゴリズムの有効性と有効性を示す実験を行った。
論文 参考訳(メタデータ) (2020-11-04T16:49:29Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。