論文の概要: Bridging Unsupervised and Semi-Supervised Anomaly Detection: A Theoretically-Grounded and Practical Framework with Synthetic Anomalies
- arxiv url: http://arxiv.org/abs/2506.13955v1
- Date: Mon, 16 Jun 2025 19:48:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.224736
- Title: Bridging Unsupervised and Semi-Supervised Anomaly Detection: A Theoretically-Grounded and Practical Framework with Synthetic Anomalies
- Title(参考訳): ブリッジングによる教師なし半監督型異常検出: 理論的に包括的で実用的な合成異常検出フレームワーク
- Authors: Matthew Lau, Tian-Yi Zhou, Xiangchi Yuan, Jizhou Chen, Wenke Lee, Xiaoming Huo,
- Abstract要約: 異常検出は、サイバーセキュリティやヘルスケアといった分野における重要なタスクである。
半教師付きADのための理論的基礎と実証的有効フレームワークを提案する。
合成異常は低密度領域におけるより良い異常モデリングを可能にすることを示す。
- 参考スコア(独自算出の注目度): 26.94405940278912
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection (AD) is a critical task across domains such as cybersecurity and healthcare. In the unsupervised setting, an effective and theoretically-grounded principle is to train classifiers to distinguish normal data from (synthetic) anomalies. We extend this principle to semi-supervised AD, where training data also include a limited labeled subset of anomalies possibly present in test time. We propose a theoretically-grounded and empirically effective framework for semi-supervised AD that combines known and synthetic anomalies during training. To analyze semi-supervised AD, we introduce the first mathematical formulation of semi-supervised AD, which generalizes unsupervised AD. Here, we show that synthetic anomalies enable (i) better anomaly modeling in low-density regions and (ii) optimal convergence guarantees for neural network classifiers -- the first theoretical result for semi-supervised AD. We empirically validate our framework on five diverse benchmarks, observing consistent performance gains. These improvements also extend beyond our theoretical framework to other classification-based AD methods, validating the generalizability of the synthetic anomaly principle in AD.
- Abstract(参考訳): 異常検出(AD)は、サイバーセキュリティや医療といった分野における重要な課題である。
教師なしの環境では、効果的で理論的に基礎付けられた原則は、正規データと(合成)異常を区別するために分類器を訓練することである。
我々はこの原理を半教師付きADに拡張し、トレーニングデータにはテスト時間内に存在する可能性のある異常の限定されたラベル付きサブセットも含まれている。
本稿では,学習中の既知の異常と合成異常を併用した,半教師付きADの理論的,実験的に有効な枠組みを提案する。
半教師なしADを解析するために,非教師なしADを一般化した半教師なしADの最初の数学的定式化を導入する。
ここでは、合成異常が有効であることを示します。
(i)低密度領域におけるより良い異常モデリング
(ii) ニューラルネットワーク分類器の最適収束保証 -- 半教師付きADの最初の理論的結果。
当社のフレームワークを5つの多様なベンチマークで実証的に検証し、一貫したパフォーマンス向上を観察します。
これらの改善は、我々の理論的な枠組みを超えて、他の分類に基づくAD手法にも及んで、ADにおける合成異常原理の一般化可能性を検証する。
関連論文リスト
- Statistical Inference for Clustering-based Anomaly Detection [7.10052009802944]
教師なし異常検出は、機械学習と統計学の基本的な問題である。
クラスタリングに基づくAD結果をテストするための新しい統計フレームワークであるSI-CLAD (Statistical Inference for Clustering-based Anomaly Detection)を提案する。
論文 参考訳(メタデータ) (2025-04-25T18:21:26Z) - Unsupervised Anomaly Detection in Multivariate Time Series across Heterogeneous Domains [0.8427519082414066]
教師なし異常検出手法をベンチマークするための統一フレームワークを提案する。
そして、実践的なAIOpsシナリオで起こりうる通常の振る舞いのシフトの問題を強調します。
ドメインシフトによる異常検出に対処するために,新しいアプローチであるDomain-Invariant VAEを提案する。
論文 参考訳(メタデータ) (2025-03-29T12:38:28Z) - VALID: a Validated Algorithm for Learning in Decentralized Networks with Possible Adversarial Presence [13.612214163974459]
不均一なデータを持つ非方向性ネットワークに対して、検証された分散学習のパラダイムを導入する。
VALIDプロトコルは、検証された学習保証を達成した最初のプロトコルである。
興味深いことに、VALIDは敵のない環境での最適なパフォーマンス指標を維持している。
論文 参考訳(メタデータ) (2024-05-12T15:55:43Z) - On the Generalization Ability of Unsupervised Pretraining [53.06175754026037]
教師なし学習の最近の進歩は、教師なし事前学習、および微調整がモデル一般化を改善することを示している。
本稿では、教師なし事前学習中に得られた知識の伝達可能性に影響を及ぼす重要な要因をその後の微調整フェーズに照らす新しい理論的枠組みを提案する。
この結果は教師なし事前学習と微調整のパラダイムの理解を深め、より効果的な事前学習アルゴリズムの設計に光を当てることができる。
論文 参考訳(メタデータ) (2024-03-11T16:23:42Z) - Random Matrix Analysis to Balance between Supervised and Unsupervised
Learning under the Low Density Separation Assumption [9.620832983703863]
線形分類モデルであるQLDSを導入し、低密度分離仮定を2次マージンで実装する。
提案アルゴリズムの特定のケースは、教師付きケースにおける最小二乗支援ベクトルマシン、完全に教師なしシステマにおけるスペクトルクラスタリング、および半教師付きグラフベースアプローチのクラスであることを示す。
論文 参考訳(メタデータ) (2023-10-20T11:46:12Z) - Domain Adaptation with Adversarial Training on Penultimate Activations [82.9977759320565]
教師なし領域適応(Unsupervised Domain Adaptation, UDA)の重要な目的は、ラベルなし対象データに対するモデル予測の信頼性を高めることである。
我々は,この戦略が,入力画像や中間特徴に対する敵対的訓練よりも予測信頼性を高める目的と,より効率的で相関性が高いことを示す。
論文 参考訳(メタデータ) (2022-08-26T19:50:46Z) - Data-Efficient and Interpretable Tabular Anomaly Detection [54.15249463477813]
本稿では,ホワイトボックスモデルクラスである一般化付加モデルを適用し,異常を検出する新しいフレームワークを提案する。
さらに、提案フレームワークであるDIADは、ラベル付きデータの少量を組み込んで、半教師付き設定における異常検出性能をさらに向上させることができる。
論文 参考訳(メタデータ) (2022-03-03T22:02:56Z) - Towards Principled Disentanglement for Domain Generalization [90.9891372499545]
機械学習モデルの根本的な課題は、アウト・オブ・ディストリビューション(OOD)データへの一般化である。
私たちはまず、DEC(Disentanglement-Constrained Domain Generalization)と呼ばれる制約付き最適化としてOOD一般化問題を定式化する。
この変換に基づいて、結合表現の不絡合と領域一般化のための原始双対アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-27T07:36:32Z) - Posterior Differential Regularization with f-divergence for Improving
Model Robustness [95.05725916287376]
クリーン入力とノイズ入力のモデル後部差を規則化する手法に着目する。
後微分正則化を$f$-divergencesの族に一般化する。
実験の結果, 後方微分を$f$-divergenceで正規化することで, モデルロバスト性の向上が期待できることがわかった。
論文 参考訳(メタデータ) (2020-10-23T19:58:01Z) - Beyond $\mathcal{H}$-Divergence: Domain Adaptation Theory With
Jensen-Shannon Divergence [21.295136514836788]
広範に評価された経験的ドメイン逆行訓練と,$mathcalH$-divergenceに基づく理論上の相似性を明らかにする。
我々は,Jensen-Shannon分散に基づく上層および下層ターゲットのリスク境界を直接証明することによって,新たな理論的枠組みを確立する。
論文 参考訳(メタデータ) (2020-07-30T16:19:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。