論文の概要: Tighten The Lasso: A Convex Hull Volume-based Anomaly Detection Method
- arxiv url: http://arxiv.org/abs/2502.18601v1
- Date: Tue, 25 Feb 2025 19:39:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-27 15:24:46.294219
- Title: Tighten The Lasso: A Convex Hull Volume-based Anomaly Detection Method
- Title(参考訳): Tighten The Lasso: Convex Hull Volume-based Anomaly Detection Method
- Authors: Uri Itai, Asael Bar Ilan, Teddy Lazebnik,
- Abstract要約: 本稿では,データセットの凸殻特性に基づく新しい異常検出アルゴリズムを提案する。
我々のアルゴリズムは、データセットからより多くのデータポイントが削除されるにつれてCHの体積を計算する。
計算的に安価で簡単なチェックにより、提案アルゴリズムに適したデータセットを検出できることを示す。
- 参考スコア(独自算出の注目度): 0.6144680854063939
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The rapid advancements in data-driven methodologies have underscored the critical importance of ensuring data quality. Consequently, detecting out-of-distribution (OOD) data has emerged as an essential task to maintain the reliability and robustness of data-driven models, in general, and machine and deep learning models, in particular. In this study, we leveraged the convex hull property of a dataset and the fact that anomalies highly contribute to the increase of the CH's volume to propose a novel anomaly detection algorithm. Our algorithm computes the CH's volume as an increasing number of data points are removed from the dataset to define a decision line between OOD and in-distribution data points. We compared the proposed algorithm to seven widely used anomaly detection algorithms over ten datasets, showing comparable results for state-of-the-art (SOTA) algorithms. Moreover, we show that with a computationally cheap and simple check, one can detect datasets that are well-suited for the proposed algorithm which outperforms the SOTA anomaly detection algorithms.
- Abstract(参考訳): データ駆動手法の急速な進歩は、データ品質を保証することの重要性を浮き彫りにした。
その結果,データ駆動モデルの信頼性と堅牢性,特にマシンラーニングモデルとディープラーニングモデルの信頼性を維持する上で,OOD(out-of-distriion)データの検出が重要な課題となっている。
本研究では,データセットの凸殻特性と異常がCH量の増加に大きく寄与するという事実を活用し,新しい異常検出アルゴリズムを提案する。
提案アルゴリズムは,OODと分布内データポイント間の決定線を定義するためにデータセットからデータポイントの数が増加するにつれてCHの体積を計算する。
提案アルゴリズムを10個のデータセット上で広く使用されている7つの異常検出アルゴリズムと比較し、最先端(SOTA)アルゴリズムに匹敵する結果を示した。
さらに,計算的に安価で簡単なチェックにより,SOTA異常検出アルゴリズムより優れた提案アルゴリズムに適したデータセットを検出できることを示す。
関連論文リスト
- Predictive Sample Assignment for Semantically Coherent Out-of-Distribution Detection [62.1052001316508]
セマンティック・コヒーレント・アウト・オブ・ディストリビューション検出(SCOOD)は、最近提案された現実的なOOD検出設定である。
予測サンプル割当て(PSA)に基づく簡潔SCOODフレームワークを提案する。
我々の手法は最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2025-12-15T01:18:38Z) - Triply Laplacian Scale Mixture Modeling for Seismic Data Noise Suppression [51.87076090814921]
ポーラシティに基づくテンソルリカバリ法は, 地震データノイズを抑制する大きな可能性を示している。
本研究では, 3次元ラプラシアンスケール混合(TLSM)による地震波の抑制手法を提案する。
論文 参考訳(メタデータ) (2025-02-20T08:28:01Z) - Fuzzy Granule Density-Based Outlier Detection with Multi-Scale Granular Balls [65.44462297594308]
外乱検出は、正常なデータの分布から大きく逸脱する異常なサンプルの同定を指す。
ほとんどの教師なしの外れ値検出方法は、指定された外れ値を検出するために慎重に設計されている。
ファジィ粗集合に基づくマルチスケールアウトレイラ検出手法を提案し,様々な種類のアウトレイラを同定する。
論文 参考訳(メタデータ) (2025-01-06T12:35:51Z) - An Efficient Outlier Detection Algorithm for Data Streaming [51.56874851156008]
Local Outlier Factor (LOF)アルゴリズムのような従来の異常検出手法は、リアルタイムデータと競合する。
本稿では,オンライン異常検出におけるLOFアルゴリズムの効率向上のための新しい手法を提案し,EILOFアルゴリズムを提案する。
EILOFアルゴリズムは計算コストを大幅に削減するだけでなく、加算点数が増加すると検出精度を体系的に改善する。
論文 参考訳(メタデータ) (2025-01-02T05:12:43Z) - Unsupervised Anomaly Detection for Tabular Data Using Noise Evaluation [26.312206159418903]
教師なし異常検出(UAD)は、現代のデータ分析において重要な役割を果たす。
データに含まれるノイズの量を評価することによって,新しいUAD手法を提案する。
提案手法が異常データの検出に有効であることを証明し,理論的保証を提供する。
論文 参考訳(メタデータ) (2024-12-16T05:35:58Z) - A Mallows-like Criterion for Anomaly Detection with Random Forest Implementation [7.569443648362081]
本稿では,複数のモデルの集約における重み付けを選択するための新しい基準を提案する。
提案手法をネットワーク侵入を含む様々な領域にわたるベンチマークデータセット上で評価した。
論文 参考訳(メタデータ) (2024-05-29T09:36:57Z) - Study of Robust Direction Finding Based on Joint Sparse Representation [2.3333781137726137]
スパース信号回復(SSR)に基づく新しいDOA推定法を提案する。
グリッドミスマッチの問題に対処するために、交互最適化アプローチを用いる。
シミュレーションの結果,提案手法は大きな外れ値に対してロバスト性を示すことがわかった。
論文 参考訳(メタデータ) (2024-05-27T02:26:37Z) - DeepHYDRA: Resource-Efficient Time-Series Anomaly Detection in Dynamically-Configured Systems [3.44012349879073]
我々はDeepHYDRA(Deep Hybrid DBSCAN/reduction-based Anomaly Detection)を提案する。
DBSCANと学習ベースの異常検出を組み合わせる。
大規模なデータセットと複雑なデータセットの両方において、異なるタイプの異常を確実に検出できることが示されている。
論文 参考訳(メタデータ) (2024-05-13T13:47:15Z) - Bagged Regularized $k$-Distances for Anomaly Detection [9.899763598214122]
BRDAD (Bagged regularized $k$-distances for Anomaly Detection) と呼ばれる距離に基づく新しいアルゴリズムを提案する。
我々のBRDADアルゴリズムは、重み付けされた密度推定のための$k$-distances(BWDDE)の実証的リスクの有限標本境界を最小化して重みを選択する。
理論的には,我々のアルゴリズムに対するAUCの高速収束率を確立し,バッグング手法が計算複雑性を著しく減少させることを示す。
論文 参考訳(メタデータ) (2023-12-02T07:00:46Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Towards Efficient and Accurate Approximation: Tensor Decomposition Based
on Randomized Block Krylov Iteration [27.85452105378894]
本研究は, rBKI-TKに基づく階層テンソルリング分解を用いて, rBKI-TKを精度よく近似するタッカー分解(rBKI-TK)を設計し, 大規模データの効率的な圧縮を行う。
データ圧縮と復調の両方において,提案手法の効率性,精度,スケーラビリティを数値的に示す。
論文 参考訳(メタデータ) (2022-11-27T13:45:28Z) - Denoising diffusion models for out-of-distribution detection [2.113925122479677]
我々は,確率拡散モデル(DDPM)を自己エンコーダの復号化として活用する。
DDPMを用いてノイズレベルの範囲の入力を再構成し,結果の多次元再構成誤差を用いてアウト・オブ・ディストリビューション入力を分類する。
論文 参考訳(メタデータ) (2022-11-14T20:35:11Z) - Framing Algorithmic Recourse for Anomaly Detection [18.347886926848563]
我々は,タブラルデータ(CARAT)における異常に対する文脈保存型アルゴリズムレコースを提案する。
CARATはトランスフォーマーベースのエンコーダデコーダモデルを用いて、低い確率で特徴を見つけることで異常を説明する。
異常なインスタンス内の特徴の全体的コンテキストを使用して、強調された特徴を変更することによって、意味的に一貫性のある反事実が生成される。
論文 参考訳(メタデータ) (2022-06-29T03:30:51Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Meta Learning Low Rank Covariance Factors for Energy-Based Deterministic
Uncertainty [58.144520501201995]
ニューラルネットワーク層のBi-Lipschitz正規化は、各レイヤの特徴空間におけるデータインスタンス間の相対距離を保存する。
注意セットエンコーダを用いて,タスク固有の共分散行列を効率的に構築するために,対角的,対角的,低ランクな要素のメタ学習を提案する。
また,最終的な予測分布を達成するために,スケールしたエネルギーを利用する推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-12T22:04:19Z) - An Efficient Anomaly Detection Approach using Cube Sampling with
Streaming Data [2.0515785954568626]
異常検出は侵入検知、健康モニタリング、故障診断、センサネットワークイベント検出など様々な分野で重要である。
孤立林(アイフォレスト)アプローチは、異常を検出するためのよく知られた手法である。
本稿では,ストリーミングデータに有効なキューブサンプリングを用いた,効率的なiForestに基づく異常検出手法を提案する。
論文 参考訳(メタデータ) (2021-10-05T04:23:00Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Am I Rare? An Intelligent Summarization Approach for Identifying Hidden
Anomalies [0.0]
本稿では,INSIDENTと呼ばれる隠れ異常を識別するインテリジェント・サマリゼーション手法を提案する。
提案手法は,各クラスタの特徴を局所重み付けすることにより,特徴空間を特徴空間に動的にマッピングするクラスタリングに基づくアルゴリズムである。
また、クラスタサイズに基づく代表者の選択は、集計データ内の元のデータと同じ分布を保持する。
論文 参考訳(メタデータ) (2020-12-24T23:22:57Z) - Stochastic Hard Thresholding Algorithms for AUC Maximization [49.00683387735522]
分散分類におけるAUCのためのハードしきい値決定アルゴリズムを開発した。
提案アルゴリズムの有効性と有効性を示す実験を行った。
論文 参考訳(メタデータ) (2020-11-04T16:49:29Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - Optimally Displaced Threshold Detection for Discriminating Binary
Coherent States Using Imperfect Devices [50.09039506170243]
雑音や不完全な装置を用いた現実的な状況下で、最適変位しきい値検出(ODTD)を有する一般化されたケネディ受信機の性能を解析的に検討する。
提案アルゴリズムは,既存の手法よりも低次かつスムーズな誤り確率が得られることを示す。
論文 参考訳(メタデータ) (2020-07-21T21:52:29Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。