論文の概要: Evaluating Anomaly Detectors for Simulated Highly Imbalanced Industrial Classification Problems
- arxiv url: http://arxiv.org/abs/2601.00005v1
- Date: Sun, 07 Dec 2025 03:49:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-11 18:48:17.480992
- Title: Evaluating Anomaly Detectors for Simulated Highly Imbalanced Industrial Classification Problems
- Title(参考訳): 高度不均衡産業分類問題に対する異常検出器の評価
- Authors: Lesley Wheat, Martin v. Mohrenschildt, Saeid Habibi,
- Abstract要約: 本稿では,問題に依存しないシミュレーションデータセットを用いて,異常検出アルゴリズムの総合評価を行う。
異常率0.05%から20%、トレーニングサイズ10000から10000のトレーニングデータセットにわたって14の検出器をベンチマークする。
以上の結果から,最高の検出器はトレーニングデータセットの欠陥例の総数に大きく依存していることが判明した。
- 参考スコア(独自算出の注目度): 1.376408511310322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning offers potential solutions to current issues in industrial systems in areas such as quality control and predictive maintenance, but also faces unique barriers in industrial applications. An ongoing challenge is extreme class imbalance, primarily due to the limited availability of faulty data during training. This paper presents a comprehensive evaluation of anomaly detection algorithms using a problem-agnostic simulated dataset that reflects real-world engineering constraints. Using a synthetic dataset with a hyper-spherical based anomaly distribution in 2D and 10D, we benchmark 14 detectors across training datasets with anomaly rates between 0.05% and 20% and training sizes between 1 000 and 10 000 (with a testing dataset size of 40 000) to assess performance and generalization error. Our findings reveal that the best detector is highly dependant on the total number of faulty examples in the training dataset, with additional healthy examples offering insignificant benefits in most cases. With less than 20 faulty examples, unsupervised methods (kNN/LOF) dominate; but around 30-50 faulty examples, semi-supervised (XGBOD) and supervised (SVM/CatBoost) detectors, we see large performance increases. While semi-supervised methods do not show significant benefits with only two features, the improvements are evident at ten features. The study highlights the performance drop on generalization of anomaly detection methods on smaller datasets, and provides practical insights for deploying anomaly detection in industrial environments.
- Abstract(参考訳): 機械学習は、品質管理や予測保守といった分野における産業システムにおける現在の問題に対する潜在的な解決策を提供するが、産業アプリケーションでは独自の障壁に直面している。
進行中の課題は、トレーニング中の障害データの可用性が限られているため、極端なクラス不均衡である。
本稿では,現実の工学的制約を反映した問題に依存しないシミュレーションデータセットを用いて,異常検出アルゴリズムの包括的評価を行う。
2Dと10Dの超球面型異常分布を持つ合成データセットを用いて、0.05%から20%の異常率と10000から10000(テストデータセットサイズ40000)のトレーニングサイズを持つトレーニングデータセットの14の検出器をベンチマークし、パフォーマンスと一般化エラーを評価する。
以上の結果から,最高の検出器はトレーニングデータセットの欠陥例の総数に大きく依存していることが判明した。
20件未満の欠陥例では、教師なし手法(kNN/LOF)が優勢であるが、30~50件の欠陥例、半教師付き(XGBOD)および教師付き(SVM/CatBoost)検出器では、大きな性能向上が見られる。
半教師付き手法は2つの特徴だけでは大きなメリットを示さないが、改善は10の特徴で明らかである。
本研究は,より小さなデータセット上での異常検出手法の一般化における性能低下に注目し,産業環境における異常検出の展開に関する実践的な洞察を提供する。
関連論文リスト
- DRL-Guided Neural Batch Sampling for Semi-Supervised Pixel-Level Anomaly Detection [0.0]
産業用視覚検査における異常検出は, 欠陥試料の不足により困難である。
本稿では,ニューラルバッチサンプリング,オートエンコーダ,予測器を統合した半教師付き深層強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-25T12:53:53Z) - ISP-AD: A Large-Scale Real-World Dataset for Advancing Industrial Anomaly Detection with Synthetic and Real Defects [0.0]
ISP-ADは、ファクトリフロアから直接収集された合成欠陥と実際の欠陥を含む、これまでで最大のパブリックな産業データセットである。
実験により、少量の注入でも弱いラベル付き実欠陥が一般化を改善することが示されている。
論文 参考訳(メタデータ) (2025-03-06T21:56:31Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - An Outlier Exposure Approach to Improve Visual Anomaly Detection
Performance for Mobile Robots [76.36017224414523]
移動ロボットの視覚異常検出システム構築の問題点を考察する。
標準異常検出モデルは、非異常データのみからなる大規模なデータセットを用いて訓練される。
本研究では,これらのデータを利用してリアルNVP異常検出モデルの性能向上を図る。
論文 参考訳(メタデータ) (2022-09-20T15:18:13Z) - Out-Of-Bag Anomaly Detection [0.9449650062296822]
データ異常は、実世界のデータセットでユビキタスであり、機械学習(ML)システムに悪影響を及ぼす可能性がある。
本稿では,新しいモデルに基づく異常検出手法を提案し,その手法をアウト・オブ・バグ検出と呼ぶ。
本手法は,家庭評価のケーススタディを通じて,データ前処理のステップとして,MLシステムの精度と信頼性を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-09-20T06:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。