論文の概要: An Evidence-Based Post-Hoc Adjustment Framework for Anomaly Detection Under Data Contamination
- arxiv url: http://arxiv.org/abs/2510.21296v1
- Date: Fri, 24 Oct 2025 09:45:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 06:57:23.40936
- Title: An Evidence-Based Post-Hoc Adjustment Framework for Anomaly Detection Under Data Contamination
- Title(参考訳): データ汚染下での異常検出のためのエビデンスに基づくポストホック調整フレームワーク
- Authors: Sukanya Patra, Souhaib Ben Taieb,
- Abstract要約: 教師なし異常検出法は、典型的にはクリーンなトレーニングデータを仮定するが、実世界のデータセットには、検出されていないまたはラベルのつかない異常が含まれていることが多い。
実験時に収集したエビデンスを用いて汚染データセット上でトレーニングされたADモデルの出力を更新するテスト時適応フレームワークであるEPHADを提案する。
- 参考スコア(独自算出の注目度): 6.001574550157585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised anomaly detection (AD) methods typically assume clean training data, yet real-world datasets often contain undetected or mislabeled anomalies, leading to significant performance degradation. Existing solutions require access to the training pipelines, data or prior knowledge of the proportions of anomalies in the data, limiting their real-world applicability. To address this challenge, we propose EPHAD, a simple yet effective test-time adaptation framework that updates the outputs of AD models trained on contaminated datasets using evidence gathered at test time. Our approach integrates the prior knowledge captured by the AD model trained on contaminated datasets with evidence derived from multimodal foundation models like Contrastive Language-Image Pre-training (CLIP), classical AD methods like the Latent Outlier Factor or domain-specific knowledge. We illustrate the intuition behind EPHAD using a synthetic toy example and validate its effectiveness through comprehensive experiments across eight visual AD datasets, twenty-six tabular AD datasets, and a real-world industrial AD dataset. Additionally, we conduct an ablation study to analyse hyperparameter influence and robustness to varying contamination levels, demonstrating the versatility and robustness of EPHAD across diverse AD models and evidence pairs. To ensure reproducibility, our code is publicly available at https://github.com/sukanyapatra1997/EPHAD.
- Abstract(参考訳): 教師なし異常検出(AD)法は、典型的にはクリーンなトレーニングデータを仮定するが、実世界のデータセットには、検出されていないまたはラベルのつかない異常がしばしば含まれ、性能が著しく低下する。
既存のソリューションでは、トレーニングパイプライン、データ、あるいはデータ内の異常の割合に関する事前の知識へのアクセスを必要とし、実際の適用性を制限する。
この課題に対処するために、EPHADを提案する。EPHADは、テスト時に収集されたエビデンスを用いて汚染データセット上でトレーニングされたADモデルの出力を更新する、シンプルで効果的なテスト時適応フレームワークである。
提案手法は,汚染されたデータセットに基づいてトレーニングされたADモデルによって得られた先行知識を,Contrastive Language- Image Pre-Turning (CLIP)やLatent Outlier Factorのような古典的なAD手法,ドメイン固有知識などの多モーダル基礎モデルから得られた証拠と統合する。
合成玩具の例を用いてEPHADの背後にある直感を解説し、8つの視覚ADデータセット、26の表ADデータセット、実世界の産業ADデータセットの総合的な実験を通してその有効性を検証する。
さらに,多種多様なADモデルとエビデンスペア間のEPHADの汎用性と堅牢性を実証し,ハイパーパラメータの影響とロバスト性を様々な汚染レベルに分析するためのアブレーション研究を行った。
再現性を確保するため、私たちのコードはhttps://github.com/sukanyapatra1997/EPHADで公開されています。
関連論文リスト
- Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - LEAD: Large Foundation Model for EEG-Based Alzheimer's Disease Detection [9.286594823355363]
認知症における脳波解析のための最初の大規模基礎モデルであるLEADを提案する。
私たちは、12のデータセット(AD関連3つ、非AD9つ)で事前トレーニングを行い、4つのADデータセットで微調整/テストを行いました。
10基のベースラインと比較して、LEADは一貫して被写体レベルの検出性能が優れている。
論文 参考訳(メタデータ) (2025-02-02T04:19:35Z) - Deep evolving semi-supervised anomaly detection [14.027613461156864]
本研究の目的は,連続的半教師付き異常検出(CSAD)のタスクを形式化することである。
本稿では,半教師付きデータを扱うための変分オートエンコーダ(VAE)のベースラインモデルを提案する。
論文 参考訳(メタデータ) (2024-12-01T15:48:37Z) - DACAD: Domain Adaptation Contrastive Learning for Anomaly Detection in Multivariate Time Series [83.76994646443498]
時系列異常検出では、ラベル付きデータの不足が正確なモデルの開発に困難をもたらす。
時系列における異常検出のための新しいドメインコントラスト学習モデル(DACAD)を提案する。
本モデルでは,ソース領域に対する教師付きコントラスト損失と,ターゲット領域に対する自己監督型コントラスト型3重項損失を用いる。
論文 参考訳(メタデータ) (2024-04-17T11:20:14Z) - Weakly Supervised Anomaly Detection via Knowledge-Data Alignment [24.125871437370357]
マルウェア検出、マネーロンダリング、デバイス障害検出、ネットワーク障害解析など、多数のWebベースのアプリケーションにおいて、異常検出が重要な役割を果たす。
Weakly Supervised Anomaly Detection (WSAD) が導入された。
本稿では,ルール知識を統合するための知識データアライメント(KDAlign)について紹介する。
論文 参考訳(メタデータ) (2024-02-06T07:57:13Z) - Anomaly Detection under Distribution Shift [24.094884041252044]
異常検出(AD)は、通常のトレーニングサンプルのセットからパターンを学習し、テストデータの異常サンプルを特定することを目的とした、重要な機械学習タスクである。
既存のAD研究の多くは、トレーニングデータとテストデータは同一のデータ分布から引き出されると仮定しているが、テストデータは大きな分散シフトを持つ可能性がある。
トレーニングおよび推論段階のOOD標準試料の分布ギャップを最小化することにより, 多様な分布シフトに対する新しいロバストADアプローチを導入する。
論文 参考訳(メタデータ) (2023-03-24T07:39:08Z) - Data-Efficient and Interpretable Tabular Anomaly Detection [54.15249463477813]
本稿では,ホワイトボックスモデルクラスである一般化付加モデルを適用し,異常を検出する新しいフレームワークを提案する。
さらに、提案フレームワークであるDIADは、ラベル付きデータの少量を組み込んで、半教師付き設定における異常検出性能をさらに向上させることができる。
論文 参考訳(メタデータ) (2022-03-03T22:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。