論文の概要: Learning a distance function with a Siamese network to localize
anomalies in videos
- arxiv url: http://arxiv.org/abs/2001.09189v1
- Date: Fri, 24 Jan 2020 20:47:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 05:26:32.987590
- Title: Learning a distance function with a Siamese network to localize
anomalies in videos
- Title(参考訳): ビデオ中の異常をローカライズするシームズネットワークを用いた距離関数の学習
- Authors: Bharathkumar Ramachandra, Michael J. Jones, Ranga Raju Vatsavai
- Abstract要約: 本研究は,監視ビデオ中の異常をローカライズするための新しいアプローチを導入する。
主な特徴は、ビデオパッチ間の距離関数を学習するために、シームズ畳み込みニューラルネットワーク(CNN)を使用することである。
学習距離関数は、対象の動画に固有のものではなく、テストビデオの各ビデオパッチと通常のトレーニングビデオに見られるビデオパッチの間の距離を測定するために使用される。
- 参考スコア(独自算出の注目度): 2.053142696037897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work introduces a new approach to localize anomalies in surveillance
video. The main novelty is the idea of using a Siamese convolutional neural
network (CNN) to learn a distance function between a pair of video patches
(spatio-temporal regions of video). The learned distance function, which is not
specific to the target video, is used to measure the distance between each
video patch in the testing video and the video patches found in normal training
video. If a testing video patch is not similar to any normal video patch then
it must be anomalous. We compare our approach to previously published
algorithms using 4 evaluation measures and 3 challenging target benchmark
datasets. Experiments show that our approach either surpasses or performs
comparably to current state-of-the-art methods.
- Abstract(参考訳): 本研究は,監視ビデオ中の異常をローカライズするための新しいアプローチを導入する。
主な特徴は、一対のビデオパッチ(spatio-temporal region of video)間の距離関数を学ぶために、シアム畳み込みニューラルネットワーク(cnn)を使用するという考えである。
学習距離関数は、対象の動画に固有のものではなく、テストビデオの各ビデオパッチと通常のトレーニングビデオに見られるビデオパッチの間の距離を測定するために使用される。
テストビデオパッチが通常のビデオパッチと似ていない場合は、異常である必要がある。
提案手法を,4つの評価尺度と3つの目標ベンチマークデータセットを用いたアルゴリズムと比較した。
実験により、我々のアプローチは現在の最先端の手法に匹敵するか、相容れない性能を示す。
関連論文リスト
- TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Anomaly detection in surveillance videos using transformer based
attention model [3.2968779106235586]
本研究は、トレーニングビデオにおける異常セグメントの注釈付けを避けるために、弱教師付き戦略を用いることを示唆する。
提案するフレームワークは,実世界のデータセット,すなわちShanghaiTech Campusデータセットで検証される。
論文 参考訳(メタデータ) (2022-06-03T12:19:39Z) - Deep Video Prior for Video Consistency and Propagation [58.250209011891904]
視覚的ビデオの時間的整合性に対する新規で一般的なアプローチを提案する。
提案手法は,大規模なデータセットではなく,オリジナルビデオとプロセッシングビデオのペアでのみ訓練される。
我々は、Deep Video Priorでビデオ上で畳み込みニューラルネットワークをトレーニングすることで、時間的一貫性を実現することができることを示す。
論文 参考訳(メタデータ) (2022-01-27T16:38:52Z) - Anomaly Crossing: A New Method for Video Anomaly Detection as
Cross-domain Few-shot Learning [32.0713939637202]
ビデオ異常検出は、ビデオで発生した異常事象を特定することを目的としている。
従来のアプローチのほとんどは、教師なしまたは半教師なしの手法で通常のビデオからのみ学習する。
本稿では,ビデオの異常検出に通常のビデオと異常ビデオの両方をフル活用することで,新たな学習パラダイムを提案する。
論文 参考訳(メタデータ) (2021-12-12T20:49:38Z) - Unsupervised Action Localization Crop in Video Retargeting for 3D
ConvNets [0.0]
3D CNNは、元々の寸法の正方形のビデオを必要とする。使用中のランダムまたはセンターカッピング技術は、ビデオの主題を完全に取り除くかもしれない。
本稿では,これを空間的・映像間合成問題として,教師なしのビデオトリミング手法を提案する。
合成ビデオは1:1のアスペクト比を維持し、サイズが小さく、一定期間にわたってビデオオブジェクトをターゲットにしている。
論文 参考訳(メタデータ) (2021-11-14T19:27:13Z) - Unsupervised Visual Representation Learning by Tracking Patches in Video [88.56860674483752]
本研究では,コンピュータビジョンシステムのプロキシタスクとしてトラッキングを用いて視覚表現を学習することを提案する。
子どもたちがプレイするキャッチゲームをベースに、視覚表現を学ぶ3D-CNNモデルのためのキャッチ・ザ・パッチ(CtP)ゲームを設計します。
論文 参考訳(メタデータ) (2021-05-06T09:46:42Z) - Blind Video Temporal Consistency via Deep Video Prior [61.062900556483164]
視覚的ビデオの時間的整合性に対する新規で一般的なアプローチを提案する。
本手法は,一対のオリジナルビデオとプロセッシングビデオを直接トレーニングするのみである。
本稿では,Deep Video Priorを用いてビデオ上の畳み込みネットワークをトレーニングすることにより,時間的一貫性を実現することができることを示す。
論文 参考訳(メタデータ) (2020-10-22T16:19:20Z) - Self-supervised Video Representation Learning by Uncovering
Spatio-temporal Statistics [74.6968179473212]
本稿では,自己指導型学習問題に対処する新しい前提課題を提案する。
最大運動の空間的位置や支配的な方向など,分割的・時間的統計的な要約を連続して計算する。
ビデオフレームを入力として与えられた統計的要約を得るために、ニューラルネットワークを構築して訓練する。
論文 参考訳(メタデータ) (2020-08-31T08:31:56Z) - Self-supervised Video Representation Learning by Pace Prediction [48.029602040786685]
本稿では,ビデオペース予測による自己指導型映像表現学習の課題に対処する。
人間の視覚系がビデオのペースに敏感であるという観察に由来する。
我々は、異なるペースでトレーニングクリップをランダムにサンプリングし、ニューラルネットワークに各ビデオクリップのペースを特定するよう依頼する。
論文 参考訳(メタデータ) (2020-08-13T12:40:24Z) - Few-shot Scene-adaptive Anomaly Detection [11.788539543098869]
本稿では,従来のアプローチの限界に対処するため,新しいシーン適応型異常検出問題を提案する。
私たちのゴールは、わずか数フレームの未確認シーンで異常を検出することを学ぶことです。
この新しい問題に対する信頼性の高いソリューションは、現実世界のアプリケーションに大きな可能性を秘めている。
論文 参考訳(メタデータ) (2020-07-15T17:08:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。