論文の概要: Bounding-Box Trajectories Matter for Video Anomaly Detection
- arxiv url: http://arxiv.org/abs/2605.21957v1
- Date: Thu, 21 May 2026 03:44:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.076766
- Title: Bounding-Box Trajectories Matter for Video Anomaly Detection
- Title(参考訳): ビデオ異常検出のためのバウンディングボックストラジェクトリ
- Authors: Inpyo Song, Jangwon Lee,
- Abstract要約: 本稿では,正規化フローを用いて多クラス境界ボックス軌道をモデル化し,通常の運動パターンを学習するTrajVADを提案する。
軌道のみの変種(TrajVAD-T)は、ポーズ推定を排除し、APにおける上海技術(87.7%)で比較されたポーズベースの手法を全て上回っている。
拡張版(TrajVAD-P)にはポーズ情報が含まれており、性能は88.6%AUROCと90.9%APに向上している。
- 参考スコア(独自算出の注目度): 2.3296196518120915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video anomaly detection is critical for public safety and security, yet remains highly challenging despite extensive research due to large variations in appearance, viewpoint, and scene dynamics. Among existing approaches, human pose-based methods have emerged as a major line of research, showing strong performance since many anomalies in public datasets involve humans and pose representations are robust to appearance changes while providing compact motion descriptions. However, these methods often overlook bounding-box trajectories, although such information is inherently available in pose-based pipelines. In this paper, we explicitly leverage these trajectories as a primary anomaly cue. We present TrajVAD, a framework that models multi-class bounding-box trajectories using normalizing flows to learn normal kinematic patterns. Its trajectory-only variant (TrajVAD-T) eliminates pose estimation and surpasses all compared pose-based methods on ShanghaiTech in AP (87.7%), while achieving the best results on MSAD. An extended version (TrajVAD-P) incorporates pose information and further improves performance to 88.6% AUROC and 90.9% AP on ShanghaiTech, highlighting bounding-box trajectories as an effective yet underexplored modality for video anomaly detection.
- Abstract(参考訳): ビデオ異常検出は、公衆の安全と安全のために重要であるが、外観、視点、シーンのダイナミクスに大きな変化があるため、広範な研究にもかかわらず、非常に困難である。
既存のアプローチの中で、人間のポーズに基づく手法が主要な研究のラインとして現れており、公開データセットの多くの異常が人間を巻き込み、ポーズ表現がコンパクトな動作記述を提供しながら外観変化に対して堅牢であることから、強いパフォーマンスを示している。
しかしながら、これらの手法はしばしば境界ボックスの軌跡を見落としているが、そのような情報は本質的にはポーズベースのパイプラインで利用できる。
本稿では,これらの軌跡を一次異常キューとして明示的に活用する。
本稿では,正規化フローを用いて多クラス境界ボックス軌道をモデル化し,通常の運動パターンを学習するTrajVADを提案する。
軌道のみの変種(TrajVAD-T)は、ポーズ推定を排除し、AP(87.7%)の上海技術で比較されたポーズベースの手法を全て上回り、MSADで最高の結果を得る。
拡張版(TrajVAD-P)では、ポーズ情報を取り込み、さらにパフォーマンスが88.6%のAUROCと90.9%のAPに向上し、ビデオ異常検出の効果的な未探索モードとしてバウンディングボックスの軌道を強調している。
関連論文リスト
- Head Anchor Enhanced Detection and Association for Crowded Pedestrian Tracking [8.653608112604472]
提案手法は,物体検出器の回帰と分類の両方から検出特徴を取り入れたものである。
動きモデリングの観点で、現代の検出器仮定に適合するように設計された反復カルマンフィルタリング手法を提案する。
論文 参考訳(メタデータ) (2025-08-07T15:47:34Z) - Attention-Aware Multi-View Pedestrian Tracking [21.393389135740712]
最近の多視点歩行者検出モデルは、早期統合戦略の可能性を強調している。
この戦略は、検出と追跡の両方のパフォーマンスを改善することが示されている。
本稿では,多視点歩行者追跡シナリオに注意機構を組み込んだ新しいモデルを提案する。
論文 参考訳(メタデータ) (2025-04-03T21:53:08Z) - Adaptive Anomaly Recovery for Telemanipulation: A Diffusion Model Approach to Vision-Based Tracking [3.9594367082013546]
本稿ではDiffusion-Enhanced Telemanipulationフレームワークを紹介する。
Frame-Difference Detection (FDD) 技術を使って、ビデオストリーム内の異常を識別し、セグメント化する。
論文 参考訳(メタデータ) (2025-03-11T20:52:01Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Future Video Prediction from a Single Frame for Video Anomaly Detection [0.38073142980732994]
ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要であるが難しい課題である。
本稿では,ビデオ異常検出のための新しいプロキシタスクとして,将来のフレーム予測プロキシタスクを紹介する。
このプロキシタスクは、より長い動きパターンを学習する従来の手法の課題を軽減する。
論文 参考訳(メタデータ) (2023-08-15T14:04:50Z) - Object-centric and memory-guided normality reconstruction for video
anomaly detection [56.64792194894702]
本稿では,ビデオ監視における異常検出問題に対処する。
異常事象の固有な規則性と不均一性のため、問題は正規性モデリング戦略と見なされる。
我々のモデルは、トレーニング中に異常なサンプルを見ることなく、オブジェクト中心の正規パターンを学習する。
論文 参考訳(メタデータ) (2022-03-07T19:28:39Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。