論文の概要: Bayesian Nonparametric Submodular Video Partition for Robust Anomaly
Detection
- arxiv url: http://arxiv.org/abs/2203.12840v1
- Date: Thu, 24 Mar 2022 04:00:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-26 00:04:08.922160
- Title: Bayesian Nonparametric Submodular Video Partition for Robust Anomaly
Detection
- Title(参考訳): ロバスト異常検出のためのベイズ非パラメトリックサブモジュールビデオ分割
- Authors: Hitesh Sapkota, Qi Yu
- Abstract要約: MIL(Multiple-instance Learning)は、ビデオ異常検出問題に対処するための効果的な方法である。
我々は,MILモデルトレーニングを大幅に改善するために,新しいベイズ非パラメトリックサブモジュールビデオ分割(BN-SVP)を提案する。
我々の理論解析は,提案アルゴリズムの性能保証を確実にする。
- 参考スコア(独自算出の注目度): 9.145168943972067
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multiple-instance learning (MIL) provides an effective way to tackle the
video anomaly detection problem by modeling it as a weakly supervised problem
as the labels are usually only available at the video level while missing for
frames due to expensive labeling cost. We propose to conduct novel Bayesian
non-parametric submodular video partition (BN-SVP) to significantly improve MIL
model training that can offer a highly reliable solution for robust anomaly
detection in practical settings that include outlier segments or multiple types
of abnormal events. BN-SVP essentially performs dynamic non-parametric
hierarchical clustering with an enhanced self-transition that groups segments
in a video into temporally consistent and semantically coherent hidden states
that can be naturally interpreted as scenes. Each segment is assumed to be
generated through a non-parametric mixture process that allows variations of
segments within the same scenes to accommodate the dynamic and noisy nature of
many real-world surveillance videos. The scene and mixture component assignment
of BN-SVP also induces a pairwise similarity among segments, resulting in
non-parametric construction of a submodular set function. Integrating this
function with an MIL loss effectively exposes the model to a diverse set of
potentially positive instances to improve its training. A greedy algorithm is
developed to optimize the submodular function and support efficient model
training. Our theoretical analysis ensures a strong performance guarantee of
the proposed algorithm. The effectiveness of the proposed approach is
demonstrated over multiple real-world anomaly video datasets with robust
detection performance.
- Abstract(参考訳): MIL(Multiple-Instance Learning)は、高額なラベリングコストのためにフレームが欠落している場合、ラベルがビデオレベルでのみ利用可能であるため、弱い教師付き問題としてモデル化することで、ビデオ異常検出問題に取り組む効果的な方法を提供する。
本稿では,異常セグメントや複数種類の異常イベントを含む実用的な設定において,ロバスト異常検出のための信頼性の高いソリューションを提供するため,milモデルのトレーニングを大幅に改善するために,新たなベイズ型非パラメトリックサブモジュラービデオパーティション(bn-svp)を提案する。
BN-SVPは本質的に動的で非パラメトリックな階層的クラスタリングを行い、ビデオ内のセグメントを時間的に一貫性があり、セマンティックに整合した隠れ状態にグループ化し、自然にシーンと解釈することができる。
各セグメントは、同じシーン内のセグメントの変動を、多くの現実世界の監視ビデオのダイナミックでノイズの多い性質に適応させる非パラメトリック混合プロセスによって生成されると仮定される。
BN-SVP のシーンと混合成分の割り当てはまた、セグメント間のペアの類似性を誘導し、非パラメトリックな部分モジュラー集合関数を構成する。
この関数をMIL損失と統合することは、トレーニングを改善するために、モデルをさまざまなポジティブなインスタンスに効果的に公開する。
サブモジュラー関数を最適化し、効率的なモデルトレーニングをサポートするためにグリーディアルゴリズムを開発した。
我々の理論解析は,提案アルゴリズムの性能保証を確実にする。
提案手法の有効性は,ロバストな検出性能を持つ実世界の複数のビデオデータセット上で実証される。
関連論文リスト
- Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。
提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。
パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-12-18T18:59:51Z) - Video Semantic Segmentation with Inter-Frame Feature Fusion and
Inner-Frame Feature Refinement [39.06589186472675]
マルチフレーム特徴量間の密接なペア関係をモデル化するための時空間融合(STF)モジュールを提案する。
さらに,セマンティックバウンダリ間の困難な予測に対処するために,メモリ拡張改良(MAR)モジュールを提案する。
論文 参考訳(メタデータ) (2023-01-10T07:57:05Z) - Regularity Learning via Explicit Distribution Modeling for Skeletal
Video Anomaly Detection [43.004613173363566]
確率的視点からポーズ動作表現を提供するために,新しい動き埋め込み (ME) を提案する。
タスク固有の空間時間変換器(STT)を自己教師型ポーズシーケンス再構築のために配置する。
MoPRLは、いくつかの挑戦的なデータセットに対して平均4.7%のAUCの改善によって最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-12-07T11:52:25Z) - Dense Unsupervised Learning for Video Segmentation [49.46930315961636]
ビデオオブジェクトセグメンテーション(VOS)のための教師なし学習のための新しいアプローチを提案する。
これまでの研究とは異なり、我々の定式化によって、完全に畳み込みの仕組みで、密集した特徴表現を直接学習することができる。
我々の手法は、トレーニングデータや計算能力が大幅に少ないにもかかわらず、以前の作業のセグメンテーション精度を超える。
論文 参考訳(メタデータ) (2021-11-11T15:15:11Z) - Reliable Shot Identification for Complex Event Detection via
Visual-Semantic Embedding [72.9370352430965]
本稿では,映像中の事象検出のための視覚的意味的誘導損失法を提案する。
カリキュラム学習に動機付け,高い信頼性の事例で分類器の訓練を開始するために,負の弾性正規化項を導入する。
提案する非ネット正規化問題の解法として,代替最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-12T11:46:56Z) - EAN: Event Adaptive Network for Enhanced Action Recognition [66.81780707955852]
本稿では,映像コンテンツの動的性質を調査するための統合された行動認識フレームワークを提案する。
まず、局所的な手がかりを抽出する際に、動的スケールの時空間カーネルを生成し、多様な事象を適応的に適合させる。
第2に、これらのキューを正確にグローバルなビデオ表現に集約するために、トランスフォーマーによって選択されたいくつかの前景オブジェクト間のインタラクションのみをマイニングすることを提案する。
論文 参考訳(メタデータ) (2021-07-22T15:57:18Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - A Hamiltonian Monte Carlo Method for Probabilistic Adversarial Attack
and Learning [122.49765136434353]
本稿では,HMCAM (Acumulated Momentum) を用いたハミルトニアンモンテカルロ法を提案する。
また, 対数的対数的対数的学習(Contrastive Adversarial Training, CAT)と呼ばれる新たな生成法を提案し, 対数的例の平衡分布にアプローチする。
いくつかの自然画像データセットと実用システムに関する定量的および定性的な解析により、提案アルゴリズムの優位性が確認された。
論文 参考訳(メタデータ) (2020-10-15T16:07:26Z) - Unsupervised Learning Consensus Model for Dynamic Texture Videos
Segmentation [12.462608802359936]
動的テクスチャのセグメンテーションのための効果的な教師なし学習コンセンサスモデルを提案する。
提案モデルでは,分類対象画素の周辺部における再量子化局所2値パターン(LBP)ヒストグラムの値の集合を特徴として用いた。
挑戦的なSynthDBデータセットで実施された実験は、ULCMが大幅に高速で、コーディングが簡単で、単純で、パラメータが限られていることを示している。
論文 参考訳(メタデータ) (2020-06-29T16:40:59Z) - Disentangling Multiple Features in Video Sequences using Gaussian
Processes in Variational Autoencoders [6.461473289206789]
ビデオシーケンスにおける非教師なし表現学習のための潜在空間をモデル化するためにガウス過程(GP)を用いる変分オートエンコーダであるMGP-VAEを導入する。
分数的ブラウン運動 (fBM) とブラウンブリッジ (BB) を用いて, 各独立チャネルにおけるフレーム間相関構造を強制し, この構造の変化によって, データの変動の異なる要因を捉えることができることを示す。
論文 参考訳(メタデータ) (2020-01-08T08:08:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。