論文の概要: DQS: A Low-Budget Query Strategy for Enhancing Unsupervised Data-driven Anomaly Detection Approaches
- arxiv url: http://arxiv.org/abs/2509.05663v1
- Date: Sat, 06 Sep 2025 09:50:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.64101
- Title: DQS: A Low-Budget Query Strategy for Enhancing Unsupervised Data-driven Anomaly Detection Approaches
- Title(参考訳): DQS: 教師なしデータ駆動型異常検出アプローチの強化のための低予算クエリ戦略
- Authors: Lucas Correia, Jan-Christoph Goos, Thomas Bäck, Anna V. Kononova,
- Abstract要約: 本研究は,既存の教師なし異常検出手法とアクティブラーニングを統合した。
我々は、DQS(dissimilarity-based query strategy)と呼ばれる新しいクエリ戦略を導入する。
- 参考スコア(独自算出の注目度): 3.3482093430607267
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Truly unsupervised approaches for time series anomaly detection are rare in the literature. Those that exist suffer from a poorly set threshold, which hampers detection performance, while others, despite claiming to be unsupervised, need to be calibrated using a labelled data subset, which is often not available in the real world. This work integrates active learning with an existing unsupervised anomaly detection method by selectively querying the labels of multivariate time series, which are then used to refine the threshold selection process. To achieve this, we introduce a novel query strategy called the dissimilarity-based query strategy (DQS). DQS aims to maximise the diversity of queried samples by evaluating the similarity between anomaly scores using dynamic time warping. We assess the detection performance of DQS in comparison to other query strategies and explore the impact of mislabelling, a topic that is underexplored in the literature. Our findings indicate that DQS performs best in small-budget scenarios, though the others appear to be more robust when faced with mislabelling. Therefore, in the real world, the choice of query strategy depends on the expertise of the oracle and the number of samples they are willing to label. Regardless, all query strategies outperform the unsupervised threshold even in the presence of mislabelling. Thus, whenever it is feasible to query an oracle, employing an active learning-based threshold is recommended.
- Abstract(参考訳): 時系列異常検出のための真に教師なしのアプローチは文献ではまれである。
検出性能を損なうような設定の不十分なしきい値に悩まされている一方で、監視されていないと主張するものもあれば、ラベル付きデータサブセットを使用して校正する必要がある。
本研究は,多変量時系列のラベルを選択的に問合せし,しきい値選択過程を洗練させることにより,既存の教師なし異常検出手法とアクティブラーニングを統合した。
そこで本研究では,DQS(dissimilarity-based query strategy)と呼ばれる新しいクエリ戦略を提案する。
DQSは、動的時間ワープを用いて異常スコア間の類似性を評価することにより、クエリされたサンプルの多様性を最大化することを目的としている。
本稿では,DQSの検出性能を他のクエリ手法と比較して評価し,文献で未検討の話題であるミスラベリングの影響について検討する。
以上の結果から,DQSは低予算のシナリオでは最善であることが明らかとなった。
したがって、現実の世界では、クエリ戦略の選択は、オラクルの専門知識と彼らがラベル付けを希望するサンプルの数に依存する。
いずれにせよ、全てのクエリ戦略は、誤動作があっても教師なしのしきい値よりも優れている。
したがって、オラクルに問い合わせることが可能となると、アクティブな学習ベースのしきい値を採用することが推奨される。
関連論文リスト
- Realistic Evaluation of Test-Time Adaptation Algorithms: Unsupervised Hyperparameter Selection [1.4530711901349282]
TTA(Test-Time Adaptation)は、分散シフト下での機械学習モデルロバストネスの問題に対処するための有望な戦略として登場した。
我々は,サロゲートベースのhp選択戦略を用いて既存のTTA手法を評価し,その性能をより現実的に評価する。
論文 参考訳(メタデータ) (2024-07-19T11:58:30Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - Efficient Detection of LLM-generated Texts with a Bayesian Surrogate Model [14.98695074168234]
本稿では,特に大規模言語モデル(LLM)から機械生成テキストを検出する新しい手法を提案する。
ベイジアンサロゲートモデルを用いて、ベイジアン不確実性に基づいて典型的なサンプルを選択し、典型的なサンプルから他のサンプルへのスコアを補間し、クエリ効率を向上させる。
実験の結果,提案手法はクエリコストの低い既存手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2023-05-26T04:23:10Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - How to Allocate your Label Budget? Choosing between Active Learning and
Learning to Reject in Anomaly Detection [15.224212372777002]
異常検出は、期待された振る舞いから逸脱する例を見つけようとする。
ラベルの欠如により、一部の地域では異常検知器は高い不確実性を持つ。
複数のラウンドでALラベルを収集するか、ラベルをリジェクトするかを判断する混合戦略を提案する。
論文 参考訳(メタデータ) (2023-01-07T18:02:43Z) - Label-Efficient Interactive Time-Series Anomaly Detection [17.799924009674694]
ラベル効率の良い対話型時系列異常検出システム(LEIAD)を提案する。
この目標を達成するために、システムは弱い監督と活発な学習を協調的に統合する。
本稿では,3つの時系列異常検出データセットについて実験を行い,提案手法が既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-30T10:16:15Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Unsupervised Model Selection for Time-series Anomaly Detection [7.8027110514393785]
提案手法は, 予測誤差, モデル中心性, および, 注入された合成異常に対する性能の3種類のサロゲート(教師なし)メトリクスを同定する。
我々は、厳密なランク集約問題として、複数の不完全なサロゲート指標との計量結合を定式化する。
複数の実世界のデータセットに対する大規模な実験は、我々の提案した教師なしアプローチが、最も正確なモデルを選択するのと同じくらい効果的であることを示す。
論文 参考訳(メタデータ) (2022-10-03T16:49:30Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - Meta-AAD: Active Anomaly Detection with Deep Reinforcement Learning [56.65934079419417]
偽陽性率が高いことは、異常検出アルゴリズムの長年の課題である。
本稿では,クエリ選択のためのメタポリシーを学習する新しいフレームワーク,Meta-AAD(Active Anomaly Detection with Meta-Policy)を提案する。
論文 参考訳(メタデータ) (2020-09-16T01:47:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。