論文の概要: Mixture of Experts Guided by Gaussian Splatters Matters: A new Approach to Weakly-Supervised Video Anomaly Detection
- arxiv url: http://arxiv.org/abs/2508.06318v1
- Date: Fri, 08 Aug 2025 13:48:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:06.243121
- Title: Mixture of Experts Guided by Gaussian Splatters Matters: A new Approach to Weakly-Supervised Video Anomaly Detection
- Title(参考訳): ガウスプラッターが指導するエキスパートの混在 : 微弱に監督されたビデオ異常検出のための新しいアプローチ
- Authors: Giacomo D'Amicantonio, Snehashis Majhi, Quan Kong, Lorenzo Garattoni, Gianpiero Francesca, François Bremond, Egor Bondarev,
- Abstract要約: ビデオ異常検出(VAD)は、異常事象のばらつきとラベル付きデータの限られた可用性のために難しい課題である。
本稿では,一組のエキスパートモデルを用いて,それぞれが特定の異常型をキャプチャする新しいフレームワークを提案する。
提案手法は,UCF-Crimeデータセット上で91.58%のAUCを達成し,XD-ViolenceデータセットとMSADデータセットにおいて優れた結果を示す。
- 参考スコア(独自算出の注目度): 7.435598538875321
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video Anomaly Detection (VAD) is a challenging task due to the variability of anomalous events and the limited availability of labeled data. Under the Weakly-Supervised VAD (WSVAD) paradigm, only video-level labels are provided during training, while predictions are made at the frame level. Although state-of-the-art models perform well on simple anomalies (e.g., explosions), they struggle with complex real-world events (e.g., shoplifting). This difficulty stems from two key issues: (1) the inability of current models to address the diversity of anomaly types, as they process all categories with a shared model, overlooking category-specific features; and (2) the weak supervision signal, which lacks precise temporal information, limiting the ability to capture nuanced anomalous patterns blended with normal events. To address these challenges, we propose Gaussian Splatting-guided Mixture of Experts (GS-MoE), a novel framework that employs a set of expert models, each specialized in capturing specific anomaly types. These experts are guided by a temporal Gaussian splatting loss, enabling the model to leverage temporal consistency and enhance weak supervision. The Gaussian splatting approach encourages a more precise and comprehensive representation of anomalies by focusing on temporal segments most likely to contain abnormal events. The predictions from these specialized experts are integrated through a mixture-of-experts mechanism to model complex relationships across diverse anomaly patterns. Our approach achieves state-of-the-art performance, with a 91.58% AUC on the UCF-Crime dataset, and demonstrates superior results on XD-Violence and MSAD datasets. By leveraging category-specific expertise and temporal guidance, GS-MoE sets a new benchmark for VAD under weak supervision.
- Abstract(参考訳): ビデオ異常検出(VAD)は、異常事象のばらつきとラベル付きデータの限られた可用性のために難しい課題である。
Weakly-Supervised VAD(WSVAD)パラダイムでは、トレーニング中にビデオレベルのラベルのみを提供し、フレームレベルで予測を行う。
最先端のモデルは単純な異常(例:爆発)でうまく機能するが、それらは複雑な現実世界のイベント(例:万引き)と競合する。
この難しさは,(1) カテゴリー固有の特徴を網羅して,すべてのカテゴリを共有モデルで処理する現在のモデルが異常な種類の多様性に対処できないこと,(2) 正確な時間的情報を欠いている弱い監視信号が,通常の事象と混在する異常なパターンを捉える能力を制限すること,の2つに起因している。
これらの課題に対処するため,我々は,特定の異常型を捉えることに特化した,一連の専門家モデルを用いた新しいフレームワークであるGaussian Splatting-Guided Mixture of Experts (GS-MoE)を提案する。
これらの専門家は、時間的ガウスのスプラッティング損失によって導かれ、モデルが時間的一貫性を活用し、監督の弱さを高めることができる。
ガウスのスプレイティングアプローチは、異常事象を含む可能性が最も高い時間セグメントに焦点を当てることで、より正確で包括的な異常表現を促進する。
これらの専門専門家の予測は、様々な異常パターンをまたいだ複雑な関係をモデル化する、Mix-of-expertsメカニズムを通じて統合される。
提案手法は,UCF-Crimeデータセット上で91.58%のAUCを達成し,XD-ViolenceデータセットとMSADデータセットにおいて優れた結果を示す。
カテゴリ固有の専門知識と時間的ガイダンスを活用することで、GS-MoEは、弱い監督の下でVADの新しいベンチマークを設定できる。
関連論文リスト
- Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [54.85000884785013]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - AMAD: AutoMasked Attention for Unsupervised Multivariate Time Series Anomaly Detection [0.7371521417300614]
AMADはUMTStextbfADシナリオに対するtextbfAutotextbfMasked Attentionを統合している。
AMADはUMTSADの課題に対して堅牢で適応可能なソリューションを提供する。
論文 参考訳(メタデータ) (2025-04-09T07:32:59Z) - Generating and Reweighting Dense Contrastive Patterns for Unsupervised
Anomaly Detection [59.34318192698142]
我々は、先行のない異常発生パラダイムを導入し、GRADと呼ばれる革新的な教師なし異常検出フレームワークを開発した。
PatchDiffは、様々な種類の異常パターンを効果的に公開する。
MVTec ADとMVTec LOCOデータセットの両方の実験も、前述の観測をサポートする。
論文 参考訳(メタデータ) (2023-12-26T07:08:06Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。