論文の概要: Multimodal Motion Conditioned Diffusion Model for Skeleton-based Video
Anomaly Detection
- arxiv url: http://arxiv.org/abs/2307.07205v3
- Date: Mon, 28 Aug 2023 10:41:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 23:03:12.140921
- Title: Multimodal Motion Conditioned Diffusion Model for Skeleton-based Video
Anomaly Detection
- Title(参考訳): 骨格型ビデオ異常検出のためのマルチモーダル運動条件拡散モデル
- Authors: Alessandro Flaborea, Luca Collorone, Guido D'Amely, Stefano D'Arrigo,
Bardh Prenkaj, Fabio Galasso
- Abstract要約: ビデオ異常検出(VAD)のための新しい生成モデルを提案する。
我々は、骨格表現を考察し、最先端拡散確率モデルを用いて、多モーダルな未来の人間のポーズを生成する。
4つの確立されたベンチマークでモデルを検証します。
- 参考スコア(独自算出の注目度): 46.8584162860564
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomalies are rare and anomaly detection is often therefore framed as
One-Class Classification (OCC), i.e. trained solely on normalcy. Leading OCC
techniques constrain the latent representations of normal motions to limited
volumes and detect as abnormal anything outside, which accounts satisfactorily
for the openset'ness of anomalies. But normalcy shares the same openset'ness
property since humans can perform the same action in several ways, which the
leading techniques neglect. We propose a novel generative model for video
anomaly detection (VAD), which assumes that both normality and abnormality are
multimodal. We consider skeletal representations and leverage state-of-the-art
diffusion probabilistic models to generate multimodal future human poses. We
contribute a novel conditioning on the past motion of people and exploit the
improved mode coverage capabilities of diffusion processes to generate
different-but-plausible future motions. Upon the statistical aggregation of
future modes, an anomaly is detected when the generated set of motions is not
pertinent to the actual future. We validate our model on 4 established
benchmarks: UBnormal, HR-UBnormal, HR-STC, and HR-Avenue, with extensive
experiments surpassing state-of-the-art results.
- Abstract(参考訳): 異常は稀であり、異常検出はしばしば一級分類 (one-class classification, occ) として分類される。
OCCをリードする手法は、正常な動きの潜在的な表現を限られたボリュームに制限し、外部の異常なものを検知する。
しかし、ノーマルシーは、人間がいくつかの方法で同じ動作をすることができるため、同じオープンセット性を共有している。
本稿では,ビデオ異常検出(VAD)のための新しい生成モデルを提案する。
骨格表現を考察し,最先端の拡散確率モデルを用いて多変量的未来の人間のポーズを生成する。
我々は,過去の人々の動作に関する新しい条件付けを提案し,拡散過程のモードカバレッジ能力を改善し,異なるが印象的な将来の動きを生成する。
未来モードを統計的に集約すると、生成された動きの集合が実際の未来に関係しない場合に異常を検出する。
提案手法は, UBnormal, HR-UBnormal, HR-STC, HR-Avenueの4つのベンチマークで検証した。
関連論文リスト
- Ensembled Cold-Diffusion Restorations for Unsupervised Anomaly Detection [7.94529540044472]
Unsupervised Anomaly Detection (UAD) は、異常のないデータセットから学習した規範的分布と比較したテストサンプル中の異常を識別することを目的としている。
生成モデルに基づくアプローチは、異常のないテスト画像を生成することによって解釈可能性を提供するが、通常、微妙な異常を識別することはできない。
本稿では, 両戦略の強みを組み合わせた新しい手法を提案する。 生成型冷拡散パイプラインは, 合成劣化画像の正常な元の外観に戻すことを目標として訓練される。
論文 参考訳(メタデータ) (2024-07-09T08:02:46Z) - GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文 参考訳(メタデータ) (2024-06-11T17:27:23Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Open-Set Multivariate Time-Series Anomaly Detection [7.127829790714167]
時系列異常検出法は、トレーニング期間中に通常のサンプルのみが利用可能であると仮定する。
監視された手法は、通常の異常や観察された異常を分類するために利用することができるが、訓練中に見られる異常に過度に適応する傾向がある。
MOSAD(Multivarate Open-Set Time-Series Anomaly Detector)と呼ばれるオープンセットTSAD問題に対処するアルゴリズムを提案する。
MOSADは、共有表現空間と、生成ヘッド、識別ヘッド、異常認識コントラストヘッドを含む特殊ヘッドを備えた、新しいマルチヘッドTSADフレームワークである。
論文 参考訳(メタデータ) (2023-10-18T19:55:11Z) - Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。
提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。
我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2021-08-01T14:33:17Z) - Unsupervised Video Anomaly Detection via Normalizing Flows with Implicit
Latent Features [8.407188666535506]
既存のほとんどのメソッドはオートエンコーダを使用して、通常のビデオの再構築を学ぶ。
本稿では2つのエンコーダが暗黙的に外観と動きの特徴をモデル化する構造である暗黙の2経路AE(ITAE)を提案する。
通常のシーンの複雑な分布については,ITAE特徴量の正規密度推定を提案する。
NFモデルは暗黙的に学習された機能を通じて正常性を学ぶことでITAEのパフォーマンスを高める。
論文 参考訳(メタデータ) (2020-10-15T05:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。