論文の概要: ADNet: A Large-Scale and Extensible Multi-Domain Benchmark for Anomaly Detection Across 380 Real-World Categories
- arxiv url: http://arxiv.org/abs/2511.20169v1
- Date: Tue, 25 Nov 2025 10:47:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.409502
- Title: ADNet: A Large-Scale and Extensible Multi-Domain Benchmark for Anomaly Detection Across 380 Real-World Categories
- Title(参考訳): ADNet: 380の現実世界カテゴリにわたる異常検出のための大規模で拡張可能なマルチドメインベンチマーク
- Authors: Hai Ling, Jia Guo, Zhulin Tao, Yunkang Cao, Donglin Di, Hongyan Xu, Xiu Su, Yang Song, Lei Fan,
- Abstract要約: 異常検出のための大規模マルチドメインベンチマークであるADNetを紹介する。
ベンチマークには合計196,294枚のRGBイメージが含まれており、トレーニング用サンプルは116,192枚、テスト用イメージは80,102枚あり、そのうち60,311枚が異常である。
Dinomaly-mは、推論コストを増大させることなくデコーダ容量を拡大するコンテキスト誘導型Mixture-of-Expertsである。
- 参考スコア(独自算出の注目度): 26.951550574484553
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Anomaly detection (AD) aims to identify defects using normal-only training data. Existing anomaly detection benchmarks (e.g., MVTec-AD with 15 categories) cover only a narrow range of categories, limiting the evaluation of cross-context generalization and scalability. We introduce ADNet, a large-scale, multi-domain benchmark comprising 380 categories aggregated from 49 publicly available datasets across Electronics, Industry, Agrifood, Infrastructure, and Medical domains. The benchmark includes a total of 196,294 RGB images, consisting of 116,192 normal samples for training and 80,102 test images, of which 60,311 are anomalous. All images are standardized with MVTec-style pixel-level annotations and structured text descriptions spanning both spatial and visual attributes, enabling multimodal anomaly detection tasks. Extensive experiments reveal a clear scalability challenge: existing state-of-the-art methods achieve 90.6% I-AUROC in one-for-one settings but drop to 78.5% when scaling to all 380 categories in a multi-class setting. To address this, we propose Dinomaly-m, a context-guided Mixture-of-Experts extension of Dinomaly that expands decoder capacity without increasing inference cost. It achieves 83.2% I-AUROC and 93.1% P-AUROC, demonstrating superior performance over existing approaches. ADNet is designed as a standardized and extensible benchmark, supporting the community in expanding anomaly detection datasets across diverse domains and providing a scalable foundation for future anomaly detection foundation models. Dataset: https://grainnet.github.io/ADNet
- Abstract(参考訳): 異常検出(AD)は、通常のトレーニングデータを用いて欠陥を特定することを目的としている。
既存の異常検出ベンチマーク(例:MVTec-ADと15のカテゴリ)は、クロスコンテキストの一般化とスケーラビリティの評価を制限し、限られたカテゴリのみをカバーする。
ADNetは、Electronic, Industry, Agrifood, Infrastructure, Medicalドメインにわたる49の公開データセットから集約された380のカテゴリからなる、大規模でマルチドメインのベンチマークである。
ベンチマークには合計196,294枚のRGBイメージが含まれており、トレーニング用サンプルは116,192枚、テスト用イメージは80,102枚あり、そのうち60,311枚が異常である。
すべての画像はMVTecスタイルのピクセルレベルのアノテーションと、空間的属性と視覚的属性の両方にまたがる構造化されたテキスト記述で標準化されており、マルチモーダルな異常検出タスクが可能である。
既存の最先端の手法は1対1設定で90.6%のI-AUROCを達成するが、マルチクラス設定で380カテゴリすべてにスケーリングすると78.5%に低下する。
そこで本稿では,推論コストを増大させることなくデコーダ容量を拡大する,コンテキスト誘導型Dinomaly-mを提案する。
83.2%のI-AUROCと93.1%のP-AUROCを達成し、既存のアプローチよりも優れた性能を示している。
ADNetは標準化された拡張可能なベンチマークとして設計されており、さまざまなドメインにわたって異常検出データセットを拡張し、将来の異常検出基盤モデルのためのスケーラブルな基盤を提供するコミュニティをサポートする。
データセット:https://grainnet.github.io/ADNet
関連論文リスト
- Real-IAD Variety: Pushing Industrial Anomaly Detection Dataset to a Modern Era [110.83702639978469]
Real-IAD Varietyは、160の異なる対象カテゴリにわたる198,960の高解像度画像からなる、最大かつ最も多様なIADベンチマークである。
その多様性は、28の産業、24の素材タイプ、22のカラーバリエーションを包括的にカバーすることで保証されている。
この重要な分野のイノベーションを促進するために、Real-IAD Varietyが公開される。
論文 参考訳(メタデータ) (2025-11-01T12:58:02Z) - Unified Unsupervised Anomaly Detection via Matching Cost Filtering [113.43366521994396]
教師なし異常検出(UAD)は、通常のトレーニングデータのみを用いて画像レベルの異常と画素レベルの異常を識別することを目的としている。
UADモデルの異常コスト量を補正するための汎用的なポストホック精錬フレームワークであるUnified Cost Filtering (UCF) を提案する。
論文 参考訳(メタデータ) (2025-10-03T03:28:18Z) - Towards Accurate Unified Anomaly Segmentation [25.415671183061317]
画像からの教師なし異常検出(UAD)は、正常なデータ分布をモデル化し、異常を識別し、ローカライズするための離散表現を作成する。
効率的で統一されたワン・フォー・オール・スキームの最近の進歩にもかかわらず、さらなる監視のために異常を正確にセグメント化することは困難である。
未解決セグメンテーションタスクに対処するため,Unified Anomaly (UniAS)を導入する。
UniASは、MVTec-ADおよびVisAデータセット上のpAP/DSCで65.12/59.33と40.06/32.50という最先端の異常セグメンテーション性能を達成する。
論文 参考訳(メタデータ) (2025-01-21T17:02:51Z) - Omni6D: Large-Vocabulary 3D Object Dataset for Category-Level 6D Object Pose Estimation [74.44739529186798]
Omni6Dは、さまざまなカテゴリとさまざまな背景を持つ総合的なRGBDデータセットである。
データセットは166のカテゴリ、標準ポーズに調整された4688のインスタンス、0.8万以上のキャプチャで構成されている。
我々は、このイニシアチブが、産業と学術の両方において、新たな洞察と実質的な進歩の道を開くと信じている。
論文 参考訳(メタデータ) (2024-09-26T20:13:33Z) - Supervised Anomaly Detection for Complex Industrial Images [4.890533180388991]
5000枚の画像からなる新規な実世界の産業データセットについて述べる。
また、(2)ベースの異常検出器(SegAD)についても紹介する。
SegADは、ローカル統計を計算するために、異常マップとセグメンテーションマップを使用する。
VADおよびVisAデータセット(+0.4%AUROC)におけるSegADの現状
論文 参考訳(メタデータ) (2024-05-08T10:47:28Z) - FiLo: Zero-Shot Anomaly Detection by Fine-Grained Description and High-Quality Localization [31.854923603517264]
本稿では,新しいゼロショット異常検出法であるFiLoを提案する。
FiLoは、適応学習されたFG-Des(FG-Des)と位置強調された高品質なローカライゼーション(HQ-Loc)の2つのコンポーネントから構成される。
MVTecやVisAのようなデータセットの実験結果から、FiLoは検出とローカライゼーションの両方においてZSADの性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2024-04-21T14:22:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。