Fugu-MT 論文翻訳(概要): Regularity Learning via Explicit Distribution Modeling for Skeletal Video Anomaly Detection

論文の概要: Regularity Learning via Explicit Distribution Modeling for Skeletal Video Anomaly Detection

arxiv url: http://arxiv.org/abs/2112.03649v1
Date: Tue, 7 Dec 2021 11:52:25 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-08 14:43:42.096746
Title: Regularity Learning via Explicit Distribution Modeling for Skeletal Video Anomaly Detection
Title（参考訳）: 骨格ビデオ異常検出のための明示的分布モデルによる正規性学習
Authors: Shoubin Yu, Zhongyin Zhao, Haoshu Fang, Andong Deng, Haisheng Su, Dongliang Wang, Weihao Gan, Cewu Lu, Wei Wu
Abstract要約: 確率的視点からポーズ動作表現を提供するために,新しい動き埋め込み (ME) を提案する。タスク固有の空間時間変換器(STT)を自己教師型ポーズシーケンス再構築のために配置する。 MoPRLは、いくつかの挑戦的なデータセットに対して平均4.7%のAUCの改善によって最先端のパフォーマンスを達成する。
参考スコア（独自算出の注目度）: 43.004613173363566
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Anomaly detection in surveillance videos is challenging and important for ensuring public security. Different from pixel-based anomaly detection methods, pose-based methods utilize highly-structured skeleton data, which decreases the computational burden and also avoids the negative impact of background noise. However, unlike pixel-based methods, which could directly exploit explicit motion features such as optical flow, pose-based methods suffer from the lack of alternative dynamic representation. In this paper, a novel Motion Embedder (ME) is proposed to provide a pose motion representation from the probability perspective. Furthermore, a novel task-specific Spatial-Temporal Transformer (STT) is deployed for self-supervised pose sequence reconstruction. These two modules are then integrated into a unified framework for pose regularity learning, which is referred to as Motion Prior Regularity Learner (MoPRL). MoPRL achieves the state-of-the-art performance by an average improvement of 4.7% AUC on several challenging datasets. Extensive experiments validate the versatility of each proposed module.
Abstract（参考訳）: 監視ビデオにおける異常検出は、公共の安全を確保する上で困難かつ重要である。画素ベースの異常検出方法と異なり、ポーズベースの手法は高度に構造化された骨格データを使用し、計算負担を低減し、背景雑音の負の影響を回避する。しかし、光学フローなどの明示的な運動特徴を直接活用できる画素ベースの手法とは異なり、ポーズベースの手法は代替の動的表現が欠如している。本稿では, 確率的視点からのポーズ動作表現を実現するために, 新たな動き埋め込み器 (me) を提案する。さらに、タスク固有の空間時間変換器(STT)を自己教師型ポーズシーケンス再構築のために配置する。これら2つのモジュールは、MoPRL(Motion Prior Regularity Learner)と呼ばれる、規則性学習のための統一されたフレームワークに統合される。 MoPRLは、いくつかの挑戦的なデータセットに対して平均4.7%のAUCの改善によって最先端のパフォーマンスを達成する。広範な実験により、各モジュールの汎用性が検証された。

関連論文リスト

GeoMotion: Rethinking Motion Segmentation via Latent 4D Geometry [61.24189040578178]
そこで本研究では,注目機構を介し,潜在特徴表現から移動対象を直接推論する完全学習型アプローチを提案する。我々の重要な洞察は、明示的な対応推定を回避し、代わりに、モデルが暗黙的にオブジェクトとカメラの動きを歪めることを学ぶことである。提案手法は,最先端の動作セグメンテーション性能を高い効率で達成する。
論文参考訳（メタデータ） (2026-02-25T11:36:33Z)
Multimodal LLM-Guided Semantic Correction in Text-to-Image Diffusion [52.315729095824906]
MLLM Semantic-Corrected Ping-Pong-Ahead Diffusion (PPAD) は,マルチモーダル大言語モデル(MLLM)を推論中の意味的オブザーバとして導入する新しいフレームワークである。中間世代をリアルタイムに分析し、潜在意味的不整合を識別し、フィードバックを制御可能な信号に変換し、残りの認知ステップを積極的に導く。大規模な実験ではPPADの大幅な改善が示されている。
論文参考訳（メタデータ） (2025-05-26T14:42:35Z)
Rethinking Contrastive Learning in Graph Anomaly Detection: A Clean-View Perspective [54.605073936695575]
グラフ異常検出は、Webセキュリティやファイナンシャル不正検出などの分野で広く応用されているグラフベースのデータにおいて、異常なパターンを特定することを目的としている。既存の手法は対照的な学習に依存しており、ノードとその局所部分グラフの間のより低い類似性は異常を示すと仮定する。干渉エッジの存在は、対照的な学習過程を損なう破壊的なノイズをもたらすため、この仮定を無効にする。コントラスト学習プロセスにおいて重要な干渉源を特定するために,複数スケールの異常認識モジュールを含むクリーンビュー拡張グラフ異常検出フレームワーク(CVGAD)を提案する。
論文参考訳（メタデータ） (2025-05-23T15:05:56Z)
Dual Conditioned Motion Diffusion for Pose-Based Video Anomaly Detection [12.100563798908777]
コンピュータビジョン研究にはビデオ異常検出(VAD)が不可欠である。既存のVADメソッドは、再構築ベースのフレームワークまたは予測ベースのフレームワークを使用する。ポーズに基づくビデオ異常検出に対処し、Dual Conditioned Motion Diffusionと呼ばれる新しいフレームワークを導入する。
論文参考訳（メタデータ） (2024-12-23T01:31:39Z)
Appearance Blur-driven AutoEncoder and Motion-guided Memory Module for Video Anomaly Detection [14.315287192621662]
ビデオ異常検出(VAD)は、しばしば正常なサンプルの分布を学習し、重要な偏差を測定することによって異常を検出する。ほとんどのVADは、新しいターゲットドメインに対するデータセット間の検証には対応できない。ゼロショットによるクロスデータセット検証を実現するため,動作誘導型メモリモジュールを用いた新しいVAD手法を提案する。
論文参考訳（メタデータ） (2024-09-26T07:48:20Z)
Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文参考訳（メタデータ） (2024-08-23T01:53:36Z)
Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文参考訳（メタデータ） (2023-12-18T09:52:14Z)
Learning from Multi-Perception Features for Real-Word Image Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文参考訳（メタデータ） (2023-05-26T07:35:49Z)
Meta-tuning Loss Functions and Data Augmentation for Few-shot Object Detection [7.262048441360132]
少ないショットのオブジェクト検出は、少数ショットの学習とオブジェクト検出という領域において、新たなトピックである。本稿では,数発検出を促進できる帰納的バイアスの学習を可能にする訓練手法を提案する。提案手法は,高パラメトリックかつ複雑な数ショットメタモデルとは対照的に,解釈可能な損失関数を生成する。
論文参考訳（メタデータ） (2023-04-24T15:14:16Z)
Single-photon Image Super-resolution via Self-supervised Learning [6.218646347012887]
SPISR(Single-Photon Image Super-Resolution)は、高分解能の光子計数キューブを、高分解能の低分解能キューブから計算画像アルゴリズムによって回収することを目的としている。 EI(Equivariant Imaging)を単一光子データに拡張することにより、SPISRタスクのための自己教師付き学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-03-03T15:52:01Z)
Bayesian Nonparametric Submodular Video Partition for Robust Anomaly Detection [9.145168943972067]
MIL(Multiple-instance Learning)は、ビデオ異常検出問題に対処するための効果的な方法である。我々は,MILモデルトレーニングを大幅に改善するために,新しいベイズ非パラメトリックサブモジュールビデオ分割(BN-SVP)を提案する。我々の理論解析は,提案アルゴリズムの性能保証を確実にする。
論文参考訳（メタデータ） (2022-03-24T04:00:49Z)
Object-centric and memory-guided normality reconstruction for video anomaly detection [56.64792194894702]
本稿では,ビデオ監視における異常検出問題に対処する。異常事象の固有な規則性と不均一性のため、問題は正規性モデリング戦略と見なされる。我々のモデルは、トレーニング中に異常なサンプルを見ることなく、オブジェクト中心の正規パターンを学習する。
論文参考訳（メタデータ） (2022-03-07T19:28:39Z)
CDN-MEDAL: Two-stage Density and Difference Approximation Framework for Motion Analysis [3.337126420148156]
本稿では,2つの畳み込みニューラルネットワークを用いた2段階変化検出手法を提案する。筆者らの2段階フレームワークは, 約3.5Kのパラメータを含むが, 複雑な動きパターンに対する迅速な収束は維持されている。
論文参考訳（メタデータ） (2021-06-07T16:39:42Z)
Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文参考訳（メタデータ） (2021-01-07T07:33:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。