Fugu-MT 論文翻訳(概要): Video Anomaly Detection with Motion and Appearance Guided Patch Diffusion Model

論文の概要: Video Anomaly Detection with Motion and Appearance Guided Patch Diffusion Model

arxiv url: http://arxiv.org/abs/2412.09026v1
Date: Thu, 12 Dec 2024 07:42:50 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-13 15:57:56.481983
Title: Video Anomaly Detection with Motion and Appearance Guided Patch Diffusion Model
Title（参考訳）: 動きと出現誘導パッチ拡散モデルによる映像異常検出
Authors: Hang Zhou, Jiale Cai, Yuteng Ye, Yonghui Feng, Chenxing Gao, Junqing Yu, Zikai Song, Wei Yang,
Abstract要約: 本稿では,ビデオ異常検出のためのパッチベース拡散モデルを提案する。モデルにシームレスに統合された革新的な動きと外観条件を導入する。提案手法の有効性を裏付ける4つの挑戦的ビデオ異常検出データセットの実験結果を得た。
参考スコア（独自算出の注目度）: 15.67669626517481
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: A recent endeavor in one class of video anomaly detection is to leverage diffusion models and posit the task as a generation problem, where the diffusion model is trained to recover normal patterns exclusively, thus reporting abnormal patterns as outliers. Yet, existing attempts neglect the various formations of anomaly and predict normal samples at the feature level regardless that abnormal objects in surveillance videos are often relatively small. To address this, a novel patch-based diffusion model is proposed, specifically engineered to capture fine-grained local information. We further observe that anomalies in videos manifest themselves as deviations in both appearance and motion. Therefore, we argue that a comprehensive solution must consider both of these aspects simultaneously to achieve accurate frame prediction. To address this, we introduce innovative motion and appearance conditions that are seamlessly integrated into our patch diffusion model. These conditions are designed to guide the model in generating coherent and contextually appropriate predictions for both semantic content and motion relations. Experimental results in four challenging video anomaly detection datasets empirically substantiate the efficacy of our proposed approach, demonstrating that it consistently outperforms most existing methods in detecting abnormal behaviors.
Abstract（参考訳）: ビデオ異常検出の一分野における最近の取り組みは、拡散モデルを利用してタスクを生成問題とみなし、拡散モデルをトレーニングして正常なパターンを排他的に復元し、異常なパターンを外れ値として報告することである。しかし、既存の試みでは、異常な映像が比較的小さいにもかかわらず、異常な形状を無視し、特徴レベルで正常なサンプルを予測している。この問題に対処するために、特にきめ細かい局所情報を捉えるために、パッチベースの新しい拡散モデルが提案されている。さらに,ビデオの異常は外見と動きのずれとして現れる。したがって,これら2つの側面を同時に考慮し,正確なフレーム予測を行なわなければならない。これを解決するために,我々のパッチ拡散モデルにシームレスに統合された革新的な動作条件と外観条件を導入する。これらの条件は、セマンティックな内容と動きの関係の両方について、一貫性と文脈的に適切な予測を生成する際にモデルを導くように設計されている。提案手法の有効性を実証的に実証した4つの挑戦的ビデオ異常検出データセットによる実験結果から,異常検出における既存の手法を一貫して上回る結果が得られた。

関連論文リスト

One-for-More: Continual Diffusion Model for Anomaly Detection [61.12622458367425]
異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文参考訳（メタデータ） (2025-02-27T07:47:27Z)
GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文参考訳（メタデータ） (2024-06-11T17:27:23Z)
AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文参考訳（メタデータ） (2023-12-10T05:13:40Z)
Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文参考訳（メタデータ） (2023-11-13T02:54:17Z)
Exploring Diffusion Models for Unsupervised Video Anomaly Detection [17.816344808780965]
本稿では,ビデオ異常検出(VAD)における拡散モデルの性能について検討する。 2つの大規模異常検出データセットで実施された実験は、最先端の生成モデルよりも提案手法の一貫性のある改善を実証している。本研究は, 拡散モデルを用いて, 監視シナリオにおけるVOD検査の指針を示す最初の研究である。
論文参考訳（メタデータ） (2023-04-12T13:16:07Z)
A Video Anomaly Detection Framework based on Appearance-Motion Semantics Representation Consistency [18.06814233420315]
本稿では,正常データの外観と動作意味表現の整合性を利用して異常検出を行うフレームワークを提案する。通常のサンプルの外観および動作情報表現を符号化する2ストリームエンコーダを設計する。異常サンプルの外観と運動特性の低い一貫性は、より大きな再構成誤差で予測されたフレームを生成するために使用できる。
論文参考訳（メタデータ） (2022-04-08T15:59:57Z)
Object-centric and memory-guided normality reconstruction for video anomaly detection [56.64792194894702]
本稿では,ビデオ監視における異常検出問題に対処する。異常事象の固有な規則性と不均一性のため、問題は正規性モデリング戦略と見なされる。我々のモデルは、トレーニング中に異常なサンプルを見ることなく、オブジェクト中心の正規パターンを学習する。
論文参考訳（メタデータ） (2022-03-07T19:28:39Z)
Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文参考訳（メタデータ） (2021-08-01T14:33:17Z)
Unsupervised Video Anomaly Detection via Normalizing Flows with Implicit Latent Features [8.407188666535506]
既存のほとんどのメソッドはオートエンコーダを使用して、通常のビデオの再構築を学ぶ。本稿では2つのエンコーダが暗黙的に外観と動きの特徴をモデル化する構造である暗黙の2経路AE(ITAE)を提案する。通常のシーンの複雑な分布については,ITAE特徴量の正規密度推定を提案する。 NFモデルは暗黙的に学習された機能を通じて正常性を学ぶことでITAEのパフォーマンスを高める。
論文参考訳（メタデータ） (2020-10-15T05:02:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。