論文の概要: Real-world Video Anomaly Detection by Extracting Salient Features in
Videos
- arxiv url: http://arxiv.org/abs/2209.06435v1
- Date: Wed, 14 Sep 2022 06:03:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-15 13:32:55.443781
- Title: Real-world Video Anomaly Detection by Extracting Salient Features in
Videos
- Title(参考訳): 映像中のサリエント特徴抽出による実世界ビデオ異常検出
- Authors: Yudai Watanabe, Makoto Okabe, Yasunori Harada, Naoji Kashima
- Abstract要約: 既存の方法は、ビデオの各セグメントの正常/異常状態を決定するために、MIL(Multiple-instance Learning)を使用していた。
本稿では,全ての入力セグメントから正常/異常を判断する上で重要な特徴を自動的に抽出する自己認識機構を備えた軽量モデルを提案する。
提案手法は,最先端手法と同等あるいは優れた精度を達成できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a lightweight and accurate method for detecting anomalies in
videos. Existing methods used multiple-instance learning (MIL) to determine the
normal/abnormal status of each segment of the video. Recent successful
researches argue that it is important to learn the temporal relationships among
segments to achieve high accuracy, instead of focusing on only a single
segment. Therefore we analyzed the existing methods that have been successful
in recent years, and found that while it is indeed important to learn all
segments together, the temporal orders among them are irrelevant to achieving
high accuracy. Based on this finding, we do not use the MIL framework, but
instead propose a lightweight model with a self-attention mechanism to
automatically extract features that are important for determining
normal/abnormal from all input segments. As a result, our neural network model
has 1.3\% of the number of parameters of the existing method. We evaluated the
frame-level detection accuracy of our method on three benchmark datasets
(UCF-Crime, ShanghaiTech, and XD-Violence) and demonstrate that our method can
achieve the comparable or better accuracy than state-of-the-art methods.
- Abstract(参考訳): ビデオ中の異常を検出するための軽量で高精度な手法を提案する。
既存の手法では、mil(multiple-instance learning)を使用して、ビデオの各セグメントの正常/異常状態を決定する。
最近の成功した研究は、1つのセグメントのみに焦点を当てるのではなく、高い精度を達成するためにセグメント間の時間的関係を学ぶことが重要であると主張している。
そこで,近年成功している手法を分析した結果,全てのセグメントを同時に学習することが本当に重要であるが,時間的順序は高い精度を達成するには無関係であることがわかった。
この発見に基づいて、我々はMILフレームワークを使うのではなく、全ての入力セグメントから正常/異常を決定するのに重要な特徴を自動的に抽出する自己認識機構を備えた軽量モデルを提案する。
その結果,ニューラルネットワークモデルは既存手法のパラメータ数の1.3\%を占めることがわかった。
我々は,3つのベンチマークデータセット(UCF-Crime, ShanghaiTech, XD-Violence)を用いて,本手法のフレームレベル検出精度を評価し,その精度が最先端手法よりも高いことを示す。
関連論文リスト
- Improving Online Lane Graph Extraction by Object-Lane Clustering [106.71926896061686]
本稿では,局所レーングラフの推定精度を向上させるために,アーキテクチャと損失の定式化を提案する。
提案手法は,中心線をクラスタ中心とすることで,対象を中心線に割り当てることを学ぶ。
提案手法は既存の3次元オブジェクト検出手法の出力を用いて,大幅な性能向上を実現することができることを示す。
論文 参考訳(メタデータ) (2023-07-20T15:21:28Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Bayesian Nonparametric Submodular Video Partition for Robust Anomaly
Detection [9.145168943972067]
MIL(Multiple-instance Learning)は、ビデオ異常検出問題に対処するための効果的な方法である。
我々は,MILモデルトレーニングを大幅に改善するために,新しいベイズ非パラメトリックサブモジュールビデオ分割(BN-SVP)を提案する。
我々の理論解析は,提案アルゴリズムの性能保証を確実にする。
論文 参考訳(メタデータ) (2022-03-24T04:00:49Z) - A concise method for feature selection via normalized frequencies [0.0]
本稿では,普遍的特徴選択のための簡潔な手法を提案する。
提案手法は, フィルタ法とラッパー法を融合して行う。
評価結果から,提案手法は,精度,精度,リコール,Fスコア,AUCの点で,いくつかの最先端技術に優れた性能を示した。
論文 参考訳(メタデータ) (2021-06-10T15:29:54Z) - Learning Salient Boundary Feature for Anchor-free Temporal Action
Localization [81.55295042558409]
時間的行動のローカライゼーションはビデオ理解において重要な課題である。
純粋にアンカーフリーな時間的定位法を初めて提案する。
このモデルには,(i)エンドツーエンドのトレーニング可能な基本予測器,(ii)サリエンシベースのリファインメントモジュール,(iii)いくつかの一貫性制約が含まれている。
論文 参考訳(メタデータ) (2021-03-24T12:28:32Z) - A Fast Point Cloud Ground Segmentation Approach Based on Coarse-To-Fine
Markov Random Field [0.32546166337127946]
粗いマルコフ確率場(MRF)法に基づく高速点雲場分割手法を提案する。
提案手法は, 地盤のセグメンテーション精度の点で他のアルゴリズムよりも優れていることを示した。
論文 参考訳(メタデータ) (2020-11-26T06:07:24Z) - Uncertainty-Aware Weakly Supervised Action Detection from Untrimmed
Videos [82.02074241700728]
本稿では,ビデオフレームラベルのみを用いてトレーニングした,禁止レベルの行動認識モデルを提案する。
人1人当たりの手法は、複数のインスタンス学習フレームワーク内の大規模な画像データセットで訓練されている。
標準的な多重インスタンス学習の仮定では、各バッグには、指定されたラベルを持つ少なくとも1つのインスタンスが含まれているという仮定が無効である場合、どのようにメソッドを適用するかを示す。
論文 参考訳(メタデータ) (2020-07-21T10:45:05Z) - Fast Template Matching and Update for Video Object Tracking and
Segmentation [56.465510428878]
私たちが取り組もうとしている主な課題は、フレームの列にまたがるマルチインスタンスの半教師付きビデオオブジェクトセグメンテーションである。
課題は、結果を予測するためのマッチングメソッドの選択と、ターゲットテンプレートを更新するかどうかを決定することである。
本稿では,これら2つの決定を同時に行うために,強化学習を利用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-04-16T08:58:45Z) - Self-trained Deep Ordinal Regression for End-to-End Video Anomaly
Detection [114.9714355807607]
ビデオ異常検出に自己学習深層順序回帰を適用することで,既存の手法の2つの重要な限界を克服できることを示す。
我々は,手動で正規/異常データをラベル付けすることなく,共同表現学習と異常スコアリングを可能にする,エンドツーエンドのトレーニング可能なビデオ異常検出手法を考案した。
論文 参考訳(メタデータ) (2020-03-15T08:44:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。