論文の概要: Regularity Learning via Explicit Distribution Modeling for Skeletal
Video Anomaly Detection
- arxiv url: http://arxiv.org/abs/2112.03649v1
- Date: Tue, 7 Dec 2021 11:52:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 14:43:42.096746
- Title: Regularity Learning via Explicit Distribution Modeling for Skeletal
Video Anomaly Detection
- Title(参考訳): 骨格ビデオ異常検出のための明示的分布モデルによる正規性学習
- Authors: Shoubin Yu, Zhongyin Zhao, Haoshu Fang, Andong Deng, Haisheng Su,
Dongliang Wang, Weihao Gan, Cewu Lu, Wei Wu
- Abstract要約: 確率的視点からポーズ動作表現を提供するために,新しい動き埋め込み (ME) を提案する。
タスク固有の空間時間変換器(STT)を自己教師型ポーズシーケンス再構築のために配置する。
MoPRLは、いくつかの挑戦的なデータセットに対して平均4.7%のAUCの改善によって最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 43.004613173363566
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomaly detection in surveillance videos is challenging and important for
ensuring public security. Different from pixel-based anomaly detection methods,
pose-based methods utilize highly-structured skeleton data, which decreases the
computational burden and also avoids the negative impact of background noise.
However, unlike pixel-based methods, which could directly exploit explicit
motion features such as optical flow, pose-based methods suffer from the lack
of alternative dynamic representation. In this paper, a novel Motion Embedder
(ME) is proposed to provide a pose motion representation from the probability
perspective. Furthermore, a novel task-specific Spatial-Temporal Transformer
(STT) is deployed for self-supervised pose sequence reconstruction. These two
modules are then integrated into a unified framework for pose regularity
learning, which is referred to as Motion Prior Regularity Learner (MoPRL).
MoPRL achieves the state-of-the-art performance by an average improvement of
4.7% AUC on several challenging datasets. Extensive experiments validate the
versatility of each proposed module.
- Abstract(参考訳): 監視ビデオにおける異常検出は、公共の安全を確保する上で困難かつ重要である。
画素ベースの異常検出方法と異なり、ポーズベースの手法は高度に構造化された骨格データを使用し、計算負担を低減し、背景雑音の負の影響を回避する。
しかし、光学フローなどの明示的な運動特徴を直接活用できる画素ベースの手法とは異なり、ポーズベースの手法は代替の動的表現が欠如している。
本稿では, 確率的視点からのポーズ動作表現を実現するために, 新たな動き埋め込み器 (me) を提案する。
さらに、タスク固有の空間時間変換器(STT)を自己教師型ポーズシーケンス再構築のために配置する。
これら2つのモジュールは、MoPRL(Motion Prior Regularity Learner)と呼ばれる、規則性学習のための統一されたフレームワークに統合される。
MoPRLは、いくつかの挑戦的なデータセットに対して平均4.7%のAUCの改善によって最先端のパフォーマンスを達成する。
広範な実験により、各モジュールの汎用性が検証された。
関連論文リスト
- Appearance Blur-driven AutoEncoder and Motion-guided Memory Module for Video Anomaly Detection [14.315287192621662]
ビデオ異常検出(VAD)は、しばしば正常なサンプルの分布を学習し、重要な偏差を測定することによって異常を検出する。
ほとんどのVADは、新しいターゲットドメインに対するデータセット間の検証には対応できない。
ゼロショットによるクロスデータセット検証を実現するため,動作誘導型メモリモジュールを用いた新しいVAD手法を提案する。
論文 参考訳(メタデータ) (2024-09-26T07:48:20Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Learning from Multi-Perception Features for Real-Word Image
Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。
本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。
また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文 参考訳(メタデータ) (2023-05-26T07:35:49Z) - Meta-tuning Loss Functions and Data Augmentation for Few-shot Object
Detection [7.262048441360132]
少ないショットのオブジェクト検出は、少数ショットの学習とオブジェクト検出という領域において、新たなトピックである。
本稿では,数発検出を促進できる帰納的バイアスの学習を可能にする訓練手法を提案する。
提案手法は,高パラメトリックかつ複雑な数ショットメタモデルとは対照的に,解釈可能な損失関数を生成する。
論文 参考訳(メタデータ) (2023-04-24T15:14:16Z) - Single-photon Image Super-resolution via Self-supervised Learning [6.218646347012887]
SPISR(Single-Photon Image Super-Resolution)は、高分解能の光子計数キューブを、高分解能の低分解能キューブから計算画像アルゴリズムによって回収することを目的としている。
EI(Equivariant Imaging)を単一光子データに拡張することにより、SPISRタスクのための自己教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-03T15:52:01Z) - Bayesian Nonparametric Submodular Video Partition for Robust Anomaly
Detection [9.145168943972067]
MIL(Multiple-instance Learning)は、ビデオ異常検出問題に対処するための効果的な方法である。
我々は,MILモデルトレーニングを大幅に改善するために,新しいベイズ非パラメトリックサブモジュールビデオ分割(BN-SVP)を提案する。
我々の理論解析は,提案アルゴリズムの性能保証を確実にする。
論文 参考訳(メタデータ) (2022-03-24T04:00:49Z) - Object-centric and memory-guided normality reconstruction for video
anomaly detection [56.64792194894702]
本稿では,ビデオ監視における異常検出問題に対処する。
異常事象の固有な規則性と不均一性のため、問題は正規性モデリング戦略と見なされる。
我々のモデルは、トレーニング中に異常なサンプルを見ることなく、オブジェクト中心の正規パターンを学習する。
論文 参考訳(メタデータ) (2022-03-07T19:28:39Z) - CDN-MEDAL: Two-stage Density and Difference Approximation Framework for
Motion Analysis [3.337126420148156]
本稿では,2つの畳み込みニューラルネットワークを用いた2段階変化検出手法を提案する。
筆者らの2段階フレームワークは, 約3.5Kのパラメータを含むが, 複雑な動きパターンに対する迅速な収束は維持されている。
論文 参考訳(メタデータ) (2021-06-07T16:39:42Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。