論文の概要: Kaputt: A Large-Scale Dataset for Visual Defect Detection
- arxiv url: http://arxiv.org/abs/2510.05903v1
- Date: Tue, 07 Oct 2025 13:13:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.264531
- Title: Kaputt: A Large-Scale Dataset for Visual Defect Detection
- Title(参考訳): Kaputt: 視覚欠陥検出のための大規模データセット
- Authors: Sebastian Höfer, Dorian Henning, Artemij Amiranashvili, Douglas Morrison, Mariliza Tzes, Ingmar Posner, Marc Matvienko, Alessandro Rennola, Anton Milan,
- Abstract要約: 物流環境における欠陥検出のための大規模データセットを提案する。
230,000以上の画像(および29,000以上の欠陥インスタンス)で、MVTec-ADの40倍の大きさである。
- 参考スコア(独自算出の注目度): 41.85463954775384
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a novel large-scale dataset for defect detection in a logistics setting. Recent work on industrial anomaly detection has primarily focused on manufacturing scenarios with highly controlled poses and a limited number of object categories. Existing benchmarks like MVTec-AD [6] and VisA [33] have reached saturation, with state-of-the-art methods achieving up to 99.9% AUROC scores. In contrast to manufacturing, anomaly detection in retail logistics faces new challenges, particularly in the diversity and variability of object pose and appearance. Leading anomaly detection methods fall short when applied to this new setting. To bridge this gap, we introduce a new benchmark that overcomes the current limitations of existing datasets. With over 230,000 images (and more than 29,000 defective instances), it is 40 times larger than MVTec-AD and contains more than 48,000 distinct objects. To validate the difficulty of the problem, we conduct an extensive evaluation of multiple state-of-the-art anomaly detection methods, demonstrating that they do not surpass 56.96% AUROC on our dataset. Further qualitative analysis confirms that existing methods struggle to leverage normal samples under heavy pose and appearance variation. With our large-scale dataset, we set a new benchmark and encourage future research towards solving this challenging problem in retail logistics anomaly detection. The dataset is available for download under https://www.kaputt-dataset.com.
- Abstract(参考訳): 物流環境における欠陥検出のための大規模データセットを提案する。
産業異常検出に関する最近の研究は、主に高度に制御されたポーズと限られた数の対象カテゴリーを持つ製造シナリオに焦点を当てている。
MVTec-AD [6] や VisA [33] のような既存のベンチマークは飽和状態に達し、最先端のメソッドは99.9%のAUROCスコアを達成している。
製造とは対照的に、リテールロジスティクスにおける異常検出は、特にオブジェクトのポーズと外観の多様性と多様性において、新しい課題に直面している。
この新たな設定に適用すると、先行する異常検出方法が不足する。
このギャップを埋めるために、既存のデータセットの現在の制限を克服する新しいベンチマークを導入する。
230,000以上の画像(および29,000以上の欠陥インスタンス)を持ち、MVTec-ADの40倍の大きさで、48,000以上の異なるオブジェクトを含んでいる。
問題の難しさを検証するため,複数の最先端異常検出手法を広範囲に評価し,56.96%のAUROCを超えないことを実証した。
さらに質的な分析により、既存の手法は、重いポーズと外観の変化の下で正常なサンプルを活用するのに苦労していることが明らかになった。
当社の大規模データセットでは、新たなベンチマークを設定し、小売物流異常検出におけるこの課題を解決するための今後の研究を奨励しています。
データセットはhttps://www.kaputt-dataset.comでダウンロードできる。
関連論文リスト
- Track Any Anomalous Object: A Granular Video Anomaly Detection Pipeline [63.96226274616927]
Track Any Anomalous Object (TAO)と呼ばれる新しいフレームワークでは、詳細なビデオ異常検出パイプラインが導入されている。
各画素に異常スコアを割り当てる手法とは異なり、我々の手法は問題から異常オブジェクトの画素レベルの追跡に変換する。
実験の結果、TAOは新しいベンチマークを精度と堅牢性で設定した。
論文 参考訳(メタデータ) (2025-06-05T15:49:39Z) - The MVTec AD 2 Dataset: Advanced Scenarios for Unsupervised Anomaly Detection [3.9682699334026563]
8000以上の高解像度画像を含む8つの異常検出シナリオの集合であるMVTec AD 2を提案する。
従来のデータセットでは考慮されていない、挑戦的で、非常に関係の深い産業検査のユースケースを含んでいる。
我々のデータセットは、実世界の分散シフト下でのメソッドのロバスト性を評価するために、照明条件の変更を伴うテストシナリオを提供する。
論文 参考訳(メタデータ) (2025-03-27T15:41:46Z) - CableInspect-AD: An Expert-Annotated Anomaly Detection Dataset [14.246172794156987]
$textitCableInspect-AD$は、カナダの公共ユーティリティであるHydro-Qu'ebecのドメインエキスパートによって作成、注釈付けされた高品質なデータセットである。
このデータセットには、現実世界の異常に挑戦する高解像度の画像が含まれており、さまざまな重度レベルの欠陥をカバーしている。
モデルの性能を評価するために,クロスバリデーションに基づく包括的評価プロトコルを提案する。
論文 参考訳(メタデータ) (2024-09-30T14:50:13Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - PKU-GoodsAD: A Supermarket Goods Dataset for Unsupervised Anomaly
Detection and Segmentation [6.950686169363205]
このデータセットは、484種類の外装品を6つのカテゴリに分けた6124個の高解像度画像を含む。
教師なしの設定に従い、通常の(欠陥のない)画像のみをトレーニングに使用する。
我々はまた、現在最先端の教師なし異常検出手法を徹底的に評価する。
論文 参考訳(メタデータ) (2023-07-11T01:17:00Z) - An Outlier Exposure Approach to Improve Visual Anomaly Detection
Performance for Mobile Robots [76.36017224414523]
移動ロボットの視覚異常検出システム構築の問題点を考察する。
標準異常検出モデルは、非異常データのみからなる大規模なデータセットを用いて訓練される。
本研究では,これらのデータを利用してリアルNVP異常検出モデルの性能向上を図る。
論文 参考訳(メタデータ) (2022-09-20T15:18:13Z) - Empirical Upper Bound, Error Diagnosis and Invariance Analysis of Modern
Object Detectors [47.64219291655723]
我々は、最先端のオブジェクト検出ベンチマークを2つ採用し、4つの大規模データセット上で15モデル以上を分析します。
モデルが空の領域に多くのボックスを生成し、そのコンテキストが大きな領域よりも小さなオブジェクトを検出するのに重要であることが分かりました。
論文 参考訳(メタデータ) (2020-04-05T06:19:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。