Fugu-MT 論文翻訳(概要): Multimodal Motion Conditioned Diffusion Model for Skeleton-based Video Anomaly Detection

論文の概要: Multimodal Motion Conditioned Diffusion Model for Skeleton-based Video Anomaly Detection

arxiv url: http://arxiv.org/abs/2307.07205v3
Date: Mon, 28 Aug 2023 10:41:07 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-29 23:03:12.140921
Title: Multimodal Motion Conditioned Diffusion Model for Skeleton-based Video Anomaly Detection
Title（参考訳）: 骨格型ビデオ異常検出のためのマルチモーダル運動条件拡散モデル
Authors: Alessandro Flaborea, Luca Collorone, Guido D'Amely, Stefano D'Arrigo, Bardh Prenkaj, Fabio Galasso
Abstract要約: ビデオ異常検出(VAD)のための新しい生成モデルを提案する。我々は、骨格表現を考察し、最先端拡散確率モデルを用いて、多モーダルな未来の人間のポーズを生成する。 4つの確立されたベンチマークでモデルを検証します。
参考スコア（独自算出の注目度）: 46.8584162860564
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Anomalies are rare and anomaly detection is often therefore framed as One-Class Classification (OCC), i.e. trained solely on normalcy. Leading OCC techniques constrain the latent representations of normal motions to limited volumes and detect as abnormal anything outside, which accounts satisfactorily for the openset'ness of anomalies. But normalcy shares the same openset'ness property since humans can perform the same action in several ways, which the leading techniques neglect. We propose a novel generative model for video anomaly detection (VAD), which assumes that both normality and abnormality are multimodal. We consider skeletal representations and leverage state-of-the-art diffusion probabilistic models to generate multimodal future human poses. We contribute a novel conditioning on the past motion of people and exploit the improved mode coverage capabilities of diffusion processes to generate different-but-plausible future motions. Upon the statistical aggregation of future modes, an anomaly is detected when the generated set of motions is not pertinent to the actual future. We validate our model on 4 established benchmarks: UBnormal, HR-UBnormal, HR-STC, and HR-Avenue, with extensive experiments surpassing state-of-the-art results.
Abstract（参考訳）: 異常は稀であり、異常検出はしばしば一級分類 (one-class classification, occ) として分類される。 OCCをリードする手法は、正常な動きの潜在的な表現を限られたボリュームに制限し、外部の異常なものを検知する。しかし、ノーマルシーは、人間がいくつかの方法で同じ動作をすることができるため、同じオープンセット性を共有している。本稿では,ビデオ異常検出(VAD)のための新しい生成モデルを提案する。骨格表現を考察し,最先端の拡散確率モデルを用いて多変量的未来の人間のポーズを生成する。我々は,過去の人々の動作に関する新しい条件付けを提案し,拡散過程のモードカバレッジ能力を改善し,異なるが印象的な将来の動きを生成する。未来モードを統計的に集約すると、生成された動きの集合が実際の未来に関係しない場合に異常を検出する。提案手法は, UBnormal, HR-UBnormal, HR-STC, HR-Avenueの4つのベンチマークで検証した。

関連論文リスト

RDDPM: Robust Denoising Diffusion Probabilistic Model for Unsupervised Anomaly Segmentation [1.4103597881677858]
拡散モデルの最近の進歩は、教師なしの異常セグメンテーションにおいて大きな成功を収めている。本研究では, 汚染された(正規データと異常データの混合)データのみを利用できるシナリオに対して, 頑健な拡散モデルを提案する。我々の手法は既存の拡散に基づくアプローチよりも優れており、最大8.08%のAUROCと10.37%のAUPRCをMVTecデータセット上で達成する。
論文参考訳（メタデータ） (2025-08-04T21:10:26Z)
Few-Shot Anomaly-Driven Generation for Anomaly Classification and Segmentation [38.76264181764036]
異常検出は, 産業検査における異常サンプルの不足により, 実用的かつ困難な課題である。本稿では,現実的かつ多様な異常を生成するために拡散モデルを誘導するAnoGen法を提案する。本手法は,DRAEMとDesTSegを基礎モデルとして構築し,一般的な産業用異常検出データセットであるMVTecの実験を行う。
論文参考訳（メタデータ） (2025-05-14T10:25:06Z)
One-for-More: Continual Diffusion Model for Anomaly Detection [61.12622458367425]
異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文参考訳（メタデータ） (2025-02-27T07:47:27Z)
Dual Conditioned Motion Diffusion for Pose-Based Video Anomaly Detection [12.100563798908777]
コンピュータビジョン研究にはビデオ異常検出(VAD)が不可欠である。既存のVADメソッドは、再構築ベースのフレームワークまたは予測ベースのフレームワークを使用する。ポーズに基づくビデオ異常検出に対処し、Dual Conditioned Motion Diffusionと呼ばれる新しいフレームワークを導入する。
論文参考訳（メタデータ） (2024-12-23T01:31:39Z)
Video Anomaly Detection with Motion and Appearance Guided Patch Diffusion Model [15.67669626517481]
本稿では,ビデオ異常検出のためのパッチベース拡散モデルを提案する。モデルにシームレスに統合された革新的な動きと外観条件を導入する。提案手法の有効性を裏付ける4つの挑戦的ビデオ異常検出データセットの実験結果を得た。
論文参考訳（メタデータ） (2024-12-12T07:42:50Z)
Ensembled Cold-Diffusion Restorations for Unsupervised Anomaly Detection [7.94529540044472]
Unsupervised Anomaly Detection (UAD) は、異常のないデータセットから学習した規範的分布と比較したテストサンプル中の異常を識別することを目的としている。生成モデルに基づくアプローチは、異常のないテスト画像を生成することによって解釈可能性を提供するが、通常、微妙な異常を識別することはできない。本稿では, 両戦略の強みを組み合わせた新しい手法を提案する。生成型冷拡散パイプラインは, 合成劣化画像の正常な元の外観に戻すことを目標として訓練される。
論文参考訳（メタデータ） (2024-07-09T08:02:46Z)
GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文参考訳（メタデータ） (2024-06-11T17:27:23Z)
AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文参考訳（メタデータ） (2023-12-10T05:13:40Z)
Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文参考訳（メタデータ） (2023-11-27T13:14:06Z)
Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文参考訳（メタデータ） (2023-11-13T02:54:17Z)
Open-Set Multivariate Time-Series Anomaly Detection [7.127829790714167]
時系列異常検出法は、トレーニング期間中に通常のサンプルのみが利用可能であると仮定する。監視された手法は、通常の異常や観察された異常を分類するために利用することができるが、訓練中に見られる異常に過度に適応する傾向がある。 MOSAD(Multivarate Open-Set Time-Series Anomaly Detector)と呼ばれるオープンセットTSAD問題に対処するアルゴリズムを提案する。 MOSADは、共有表現空間と、生成ヘッド、識別ヘッド、異常認識コントラストヘッドを含む特殊ヘッドを備えた、新しいマルチヘッドTSADフレームワークである。
論文参考訳（メタデータ） (2023-10-18T19:55:11Z)
Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文参考訳（メタデータ） (2021-08-01T14:33:17Z)
Unsupervised Video Anomaly Detection via Normalizing Flows with Implicit Latent Features [8.407188666535506]
既存のほとんどのメソッドはオートエンコーダを使用して、通常のビデオの再構築を学ぶ。本稿では2つのエンコーダが暗黙的に外観と動きの特徴をモデル化する構造である暗黙の2経路AE(ITAE)を提案する。通常のシーンの複雑な分布については,ITAE特徴量の正規密度推定を提案する。 NFモデルは暗黙的に学習された機能を通じて正常性を学ぶことでITAEのパフォーマンスを高める。
論文参考訳（メタデータ） (2020-10-15T05:02:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。