論文の概要: From Benchmarks to Reality: Advancing Visual Anomaly Detection by the VAND 3.0 Challenge
- arxiv url: http://arxiv.org/abs/2509.17615v1
- Date: Mon, 22 Sep 2025 11:27:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.340477
- Title: From Benchmarks to Reality: Advancing Visual Anomaly Detection by the VAND 3.0 Challenge
- Title(参考訳): ベンチマークから現実へ:VAND 3.0チャレンジによる視覚異常検出の改善
- Authors: Lars Heckler-Kram, Ashwin Vaidya, Jan-Hendrik Neudeck, Ulla Scheler, Dick Ameln, Samet Akcay, Paula Ramos,
- Abstract要約: 本稿では, 異常検出の現在の進歩を示すために, VAND 3.0 Challengeを提案する。
このチャレンジでは2つのトラックが開催され、現実世界の分布シフトに対して堅牢な異常検出手法の開発が促進された。
参加者のソリューションは、既存のアプローチを組み合わせたり、適応させたりすることで、以前のベースラインよりも大幅に改善された。
- 参考スコア(独自算出の注目度): 4.03804045800094
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Visual anomaly detection is a strongly application-driven field of research. Consequently, the connection between academia and industry is of paramount importance. In this regard, we present the VAND 3.0 Challenge to showcase current progress in anomaly detection across different practical settings whilst addressing critical issues in the field. The challenge hosted two tracks, fostering the development of anomaly detection methods robust against real-world distribution shifts (Category 1) and exploring the capabilities of Vision Language Models within the few-shot regime (Category 2), respectively. The participants' solutions reached significant improvements over previous baselines by combining or adapting existing approaches and fusing them with novel pipelines. While for both tracks the progress in large pre-trained vision (language) backbones played a pivotal role for the performance increase, scaling up anomaly detection methods more efficiently needs to be addressed by future research to meet real-time and computational constraints on-site.
- Abstract(参考訳): 視覚異常検出は、強い応用駆動の研究分野である。
結果として、学界と産業の結びつきが最重要となる。
本稿では,現場における重要な問題に対処しつつ,様々な実践的状況における異常検出の進展を示すために,VAND 3.0 Challengeを提案する。
このチャレンジでは、2つのトラックが開催され、現実世界の流通シフトに対して堅牢な異常検出手法の開発が促進され(第1回)、第2回(第2回)ではビジョン言語モデルの能力が探索された。
参加者のソリューションは、既存のアプローチを組み合わせたり、適応させたりすることで、以前のベースラインよりも大幅に改善された。
両トラックとも、大きな事前学習された視覚(言語)のバックボーンの進歩は、パフォーマンス向上に重要な役割を担ったが、リアルタイムおよび計算上の制約を満たすために、将来の研究によって、より効率的に異常検出手法をスケールアップする必要がある。
関連論文リスト
- DINO-CoDT: Multi-class Collaborative Detection and Tracking with Vision Foundation Models [11.34839442803445]
道路利用者を対象とした多クラス協調検出・追跡フレームワークを提案する。
まず,大域的空間注意融合(GSAF)モジュールを用いた検出器を提案する。
次に,視覚基盤モデルを用いた視覚的セマンティクスを活用し,IDSW(ID SWitch)エラーを効果的に低減するトラックレットRe-IDentification(REID)モジュールを提案する。
論文 参考訳(メタデータ) (2025-06-09T02:49:10Z) - Enhancing Abnormality Identification: Robust Out-of-Distribution Strategies for Deepfake Detection [2.4851820343103035]
本稿では,2つの新しいOf-Distribution(OOD)検出手法を提案する。
第1のアプローチは入力画像の再構築のために訓練され、第2のアプローチはOODを検出するための注意機構が組み込まれている。
提案手法は,ベンチマーク上での最高性能構成のうち,深度検出とランク付けにおいて有望な結果が得られる。
論文 参考訳(メタデータ) (2025-06-03T13:24:33Z) - Robust Distribution Alignment for Industrial Anomaly Detection under Distribution Shift [51.24522135151649]
異常検出は産業アプリケーションの品質管理において重要な役割を担っている。
既存の方法は、一般化可能なモデルをトレーニングすることで、ドメインシフトに対処しようとする。
提案手法は,最先端の異常検出法や領域適応法と比較して,優れた結果を示す。
論文 参考訳(メタデータ) (2025-03-19T05:25:52Z) - Online Model-based Anomaly Detection in Multivariate Time Series: Taxonomy, Survey, Research Challenges and Future Directions [0.017476232824732776]
時系列異常検出は、エンジニアリングプロセスにおいて重要な役割を果たす。
この調査では、オンラインとオフラインの区別とトレーニングと推論を行う新しい分類法を紹介した。
文献で使用される最も一般的なデータセットと評価指標、および詳細な分析を示す。
論文 参考訳(メタデータ) (2024-08-07T13:01:10Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Transformer-based Multimodal Change Detection with Multitask Consistency Constraints [10.906283981247796]
現在の変化検出方法は、意味変化検出タスクと高さ変化検出タスクのマルチタスク競合に対処する。
そこで我々は,クロスアテンションにより,多次元入力間の共有表現を学習する効率的なトランスフォーマーネットワークを提案する。
提案手法は,5つの現状変化検出手法と比較して,意味的および高さ変化検出の観点から,一貫したマルチタスク優位性を示す。
論文 参考訳(メタデータ) (2023-10-13T17:38:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。