論文の概要: Mixture of Experts Guided by Gaussian Splatters Matters: A new Approach to Weakly-Supervised Video Anomaly Detection
- arxiv url: http://arxiv.org/abs/2508.06318v1
- Date: Fri, 08 Aug 2025 13:48:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:06.243121
- Title: Mixture of Experts Guided by Gaussian Splatters Matters: A new Approach to Weakly-Supervised Video Anomaly Detection
- Title(参考訳): ガウスプラッターが指導するエキスパートの混在 : 微弱に監督されたビデオ異常検出のための新しいアプローチ
- Authors: Giacomo D'Amicantonio, Snehashis Majhi, Quan Kong, Lorenzo Garattoni, Gianpiero Francesca, François Bremond, Egor Bondarev,
- Abstract要約: ビデオ異常検出(VAD)は、異常事象のばらつきとラベル付きデータの限られた可用性のために難しい課題である。
本稿では,一組のエキスパートモデルを用いて,それぞれが特定の異常型をキャプチャする新しいフレームワークを提案する。
提案手法は,UCF-Crimeデータセット上で91.58%のAUCを達成し,XD-ViolenceデータセットとMSADデータセットにおいて優れた結果を示す。
- 参考スコア(独自算出の注目度): 7.435598538875321
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video Anomaly Detection (VAD) is a challenging task due to the variability of anomalous events and the limited availability of labeled data. Under the Weakly-Supervised VAD (WSVAD) paradigm, only video-level labels are provided during training, while predictions are made at the frame level. Although state-of-the-art models perform well on simple anomalies (e.g., explosions), they struggle with complex real-world events (e.g., shoplifting). This difficulty stems from two key issues: (1) the inability of current models to address the diversity of anomaly types, as they process all categories with a shared model, overlooking category-specific features; and (2) the weak supervision signal, which lacks precise temporal information, limiting the ability to capture nuanced anomalous patterns blended with normal events. To address these challenges, we propose Gaussian Splatting-guided Mixture of Experts (GS-MoE), a novel framework that employs a set of expert models, each specialized in capturing specific anomaly types. These experts are guided by a temporal Gaussian splatting loss, enabling the model to leverage temporal consistency and enhance weak supervision. The Gaussian splatting approach encourages a more precise and comprehensive representation of anomalies by focusing on temporal segments most likely to contain abnormal events. The predictions from these specialized experts are integrated through a mixture-of-experts mechanism to model complex relationships across diverse anomaly patterns. Our approach achieves state-of-the-art performance, with a 91.58% AUC on the UCF-Crime dataset, and demonstrates superior results on XD-Violence and MSAD datasets. By leveraging category-specific expertise and temporal guidance, GS-MoE sets a new benchmark for VAD under weak supervision.
- Abstract(参考訳): ビデオ異常検出(VAD)は、異常事象のばらつきとラベル付きデータの限られた可用性のために難しい課題である。
Weakly-Supervised VAD(WSVAD)パラダイムでは、トレーニング中にビデオレベルのラベルのみを提供し、フレームレベルで予測を行う。
最先端のモデルは単純な異常(例:爆発)でうまく機能するが、それらは複雑な現実世界のイベント(例:万引き)と競合する。
この難しさは,(1) カテゴリー固有の特徴を網羅して,すべてのカテゴリを共有モデルで処理する現在のモデルが異常な種類の多様性に対処できないこと,(2) 正確な時間的情報を欠いている弱い監視信号が,通常の事象と混在する異常なパターンを捉える能力を制限すること,の2つに起因している。
これらの課題に対処するため,我々は,特定の異常型を捉えることに特化した,一連の専門家モデルを用いた新しいフレームワークであるGaussian Splatting-Guided Mixture of Experts (GS-MoE)を提案する。
これらの専門家は、時間的ガウスのスプラッティング損失によって導かれ、モデルが時間的一貫性を活用し、監督の弱さを高めることができる。
ガウスのスプレイティングアプローチは、異常事象を含む可能性が最も高い時間セグメントに焦点を当てることで、より正確で包括的な異常表現を促進する。
これらの専門専門家の予測は、様々な異常パターンをまたいだ複雑な関係をモデル化する、Mix-of-expertsメカニズムを通じて統合される。
提案手法は,UCF-Crimeデータセット上で91.58%のAUCを達成し,XD-ViolenceデータセットとMSADデータセットにおいて優れた結果を示す。
カテゴリ固有の専門知識と時間的ガイダンスを活用することで、GS-MoEは、弱い監督の下でVADの新しいベンチマークを設定できる。
関連論文リスト
- Labels Matter More Than Models: Quantifying the Benefit of Supervised Time Series Anomaly Detection [56.302586730134806]
時系列異常検出(TSAD)は、しばしばラベル不足によって制約される重要なデータマイニングタスクである。
現在の研究は、主に教師なし時系列異常検出に焦点を当てている。
本稿では,アーキテクチャの複雑さがTSADの最適経路である,という前提に挑戦する。
論文 参考訳(メタデータ) (2025-11-20T08:32:49Z) - Correcting False Alarms from Unseen: Adapting Graph Anomaly Detectors at Test Time [60.341117019125214]
グラフ異常検出(GAD)における未確認正規pattErnsの修正のための,軽量かつプラグアンドプレイなテスト時間適応フレームワークを提案する。
意味的混乱に対処するために、シフトしたデータと元のデータとをグラフ属性レベルで整合させるグラフ整合器を用いる。
10個の実世界のデータセットに対する大規模な実験により、TUNEは事前学習されたGADモデルの合成パターンと実際の見えない正常パターンの両方への一般化性を著しく向上することが示された。
論文 参考訳(メタデータ) (2025-11-10T12:10:05Z) - THEMIS: Unlocking Pretrained Knowledge with Foundation Model Embeddings for Anomaly Detection in Time Series [0.0]
TheMISは、基礎モデルから事前学習された知識を活用する時系列異常検出のための新しいフレームワークである。
実験の結果,本手法はMSLデータセット上でSOTAを達成し,SMAPおよびSWAT$*$データセット上で非常に競争力があることがわかった。
論文 参考訳(メタデータ) (2025-10-04T19:20:35Z) - Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [54.85000884785013]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - Strengthening Anomaly Awareness [0.0]
我々は、教師なし異常検出の強化を目的とした、異常認識フレームワークの洗練されたバージョンを提案する。
本稿では,2段階のトレーニング戦略を通じて,変分オートエンコーダ(VAE)の最小限の監視を導入する。
論文 参考訳(メタデータ) (2025-04-15T16:52:22Z) - AMAD: AutoMasked Attention for Unsupervised Multivariate Time Series Anomaly Detection [0.7371521417300614]
AMADはUMTStextbfADシナリオに対するtextbfAutotextbfMasked Attentionを統合している。
AMADはUMTSADの課題に対して堅牢で適応可能なソリューションを提供する。
論文 参考訳(メタデータ) (2025-04-09T07:32:59Z) - Cross-Modal Fusion and Attention Mechanism for Weakly Supervised Video Anomaly Detection [2.749898166276854]
弱教師付きビデオ異常検出(WS-VAD)が現代研究の方向性として浮上している。
暴力やヌードなどの異常を正確に検出するマルチモーダルなWS-VADフレームワークを提案する。
提案モデルでは,暴力とヌード検出のベンチマークデータセットを用いて,最先端の結果が得られた。
論文 参考訳(メタデータ) (2024-12-29T12:46:57Z) - Generating and Reweighting Dense Contrastive Patterns for Unsupervised
Anomaly Detection [59.34318192698142]
我々は、先行のない異常発生パラダイムを導入し、GRADと呼ばれる革新的な教師なし異常検出フレームワークを開発した。
PatchDiffは、様々な種類の異常パターンを効果的に公開する。
MVTec ADとMVTec LOCOデータセットの両方の実験も、前述の観測をサポートする。
論文 参考訳(メタデータ) (2023-12-26T07:08:06Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。