論文の概要: A Hierarchical Spatio-Temporal Graph Convolutional Neural Network for
Anomaly Detection in Videos
- arxiv url: http://arxiv.org/abs/2112.04294v1
- Date: Wed, 8 Dec 2021 14:03:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-09 18:54:10.747946
- Title: A Hierarchical Spatio-Temporal Graph Convolutional Neural Network for
Anomaly Detection in Videos
- Title(参考訳): ビデオにおける異常検出のための階層型時空間グラフ畳み込みニューラルネットワーク
- Authors: Xianlin Zeng, Yalong Jiang, Wenrui Ding, Hongguang Li, Yafeng Hao,
Zifeng Qiu
- Abstract要約: これらの問題に対処する階層型時空間グラフ畳み込みニューラルネットワーク(HSTGCNN)を提案する。
HSTGCNNは、グラフ表現の異なるレベルに対応する複数のブランチで構成されている。
高レベルグラフ表現は、低解像度ビデオにおける人々の移動速度と方向を符号化するために、高レベルグラフ表現は、高解像度ビデオにおける人間の骨格を符号化するために、高レベルグラフ表現が割り当てられる。
- 参考スコア(独自算出の注目度): 11.423072255384469
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning models have been widely used for anomaly detection in
surveillance videos. Typical models are equipped with the capability to
reconstruct normal videos and evaluate the reconstruction errors on anomalous
videos to indicate the extent of abnormalities. However, existing approaches
suffer from two disadvantages. Firstly, they can only encode the movements of
each identity independently, without considering the interactions among
identities which may also indicate anomalies. Secondly, they leverage
inflexible models whose structures are fixed under different scenes, this
configuration disables the understanding of scenes. In this paper, we propose a
Hierarchical Spatio-Temporal Graph Convolutional Neural Network (HSTGCNN) to
address these problems, the HSTGCNN is composed of multiple branches that
correspond to different levels of graph representations. High-level graph
representations encode the trajectories of people and the interactions among
multiple identities while low-level graph representations encode the local body
postures of each person. Furthermore, we propose to weightedly combine multiple
branches that are better at different scenes. An improvement over single-level
graph representations is achieved in this way. An understanding of scenes is
achieved and serves anomaly detection. High-level graph representations are
assigned higher weights to encode moving speed and directions of people in
low-resolution videos while low-level graph representations are assigned higher
weights to encode human skeletons in high-resolution videos. Experimental
results show that the proposed HSTGCNN significantly outperforms current
state-of-the-art models on four benchmark datasets (UCSD Pedestrian,
ShanghaiTech, CUHK Avenue and IITB-Corridor) by using much less learnable
parameters.
- Abstract(参考訳): ディープラーニングモデルは監視ビデオの異常検出に広く利用されている。
典型的なモデルは、正常なビデオの再構成機能を備え、異常の程度を示すために異常なビデオの再構成エラーを評価する。
しかし、既存のアプローチには2つの欠点がある。
第一に、個々のアイデンティティの動きを、異常を示す可能性のあるアイデンティティ間の相互作用を考慮せずに、独立に符号化できる。
第2に、異なるシーンで固定された構造を持つ非フレキシブルモデルを活用し、この構成はシーンの理解を無効にする。
本稿では,これらの問題に対処する階層型時空間グラフ畳み込みニューラルネットワーク(HSTGCNN)を提案する。
高レベルグラフ表現は人の軌跡と複数のアイデンティティ間の相互作用をエンコードし、低レベルグラフ表現は各人の身体姿勢をエンコードする。
さらに,異なる場面でより優れた複数の枝を重み付けする手法を提案する。
このように、シングルレベルグラフ表現の改善が達成される。
シーンの理解が達成され、異常検出に役立つ。
ハイレベルグラフ表現は低解像度ビデオで人の移動速度と方向をエンコードするために高重みが割り当てられ、低レベルグラフ表現は高解像度ビデオで人間の骨格をエンコードするために高重みが割り当てられる。
実験結果から,提案したHSTGCNNは,学習可能なパラメータをはるかに少なくすることで,4つのベンチマークデータセット(UCSD Pedestrian, ShanghaiTech, CUHK Avenue, IITB-Corridor)の最先端モデルを著しく上回ることがわかった。
関連論文リスト
- ADA-GAD: Anomaly-Denoised Autoencoders for Graph Anomaly Detection [84.0718034981805]
我々はAnomaly-Denoized Autoencoders for Graph Anomaly Detection (ADA-GAD)という新しいフレームワークを導入する。
第1段階では,異常レベルを低減したグラフを生成する学習自由な異常化拡張法を設計する。
次の段階では、デコーダは元のグラフで検出するために再訓練される。
論文 参考訳(メタデータ) (2023-12-22T09:02:01Z) - Networked Time Series Imputation via Position-aware Graph Enhanced
Variational Autoencoders [31.953958053709805]
我々は,変分オートエンコーダ(VAE)を利用して,ノード時系列の特徴とグラフ構造の両方に欠落する値を予測するPoGeVonという新しいモデルを設計する。
実験の結果,ベースライン上でのモデルの有効性が示された。
論文 参考訳(メタデータ) (2023-05-29T21:11:34Z) - Adaptive graph convolutional networks for weakly supervised anomaly
detection in videos [42.3118758940767]
本稿では,映像セグメント間のコンテキスト関係をモデル化するために,弱教師付き適応グラフ畳み込みネットワーク(WAGCN)を提案する。
各セグメントの異常確率スコアを生成する際に、他のビデオセグメントが現在のセグメントに与える影響を十分に検討する。
論文 参考訳(メタデータ) (2022-02-14T06:31:34Z) - Deep Graph-level Anomaly Detection by Glocal Knowledge Distillation [61.39364567221311]
グラフレベルの異常検出(GAD)は、その構造やノードの特徴に異常なグラフを検出する問題を記述している。
GADの課題の1つは、局所的および大域的非正則グラフの検出を可能にするグラフ表現を考案することである。
本稿では,グラフとノード表現の連成ランダム蒸留により,グローバルおよびローカルな正規パターン情報を豊富に学習するGADのための新しい深部異常検出手法を提案する。
論文 参考訳(メタデータ) (2021-12-19T05:04:53Z) - A Deep Latent Space Model for Graph Representation Learning [10.914558012458425]
本稿では,従来の潜時変動に基づく生成モデルをディープラーニングフレームワークに組み込むために,有向グラフのための深潜時空間モデル(DLSM)を提案する。
提案モデルは,階層的変動型オートエンコーダアーキテクチャによって階層的に接続されるグラフ畳み込みネットワーク(GCN)エンコーダとデコーダから構成される。
実世界のデータセットにおける実験により,提案モデルがリンク予測とコミュニティ検出の両タスクにおける最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2021-06-22T12:41:19Z) - Learning Multi-Granular Hypergraphs for Video-Based Person
Re-Identification [110.52328716130022]
ビデオベースの人物識別(re-ID)はコンピュータビジョンにおいて重要な研究課題である。
MGH(Multi-Granular Hypergraph)という新しいグラフベースのフレームワークを提案する。
MARSの90.0%のトップ-1精度はMGHを用いて達成され、最先端のスキームよりも優れていた。
論文 参考訳(メタデータ) (2021-04-30T11:20:02Z) - Spatial-Temporal Correlation and Topology Learning for Person
Re-Identification in Videos [78.45050529204701]
クロススケール空間時空間相関をモデル化し, 識別的, 堅牢な表現を追求する新しい枠組みを提案する。
CTLはCNNバックボーンとキーポイント推定器を使用して人体から意味的局所的特徴を抽出する。
グローバルな文脈情報と人体の物理的接続の両方を考慮して、多スケールグラフを構築するためのコンテキスト強化トポロジーを探求する。
論文 参考訳(メタデータ) (2021-04-15T14:32:12Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。