論文の概要: Interleaving One-Class and Weakly-Supervised Models with Adaptive Thresholding for Unsupervised Video Anomaly Detection
- arxiv url: http://arxiv.org/abs/2401.13551v2
- Date: Mon, 30 Sep 2024 14:41:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-01 21:59:46.749893
- Title: Interleaving One-Class and Weakly-Supervised Models with Adaptive Thresholding for Unsupervised Video Anomaly Detection
- Title(参考訳): 教師なしビデオ異常検出のための適応閾値付きワンクラスモデルと弱スーパービジョンモデルとのインターリービング
- Authors: Yongwei Nie, Hao Huang, Chengjiang Long, Qing Zhang, Pradipta Maji, Hongmin Cai,
- Abstract要約: ビデオ異常検出(VAD)は、ワンクラス分類(OCC)と弱教師付き学習(WS)の設定下で広く研究されている。
本稿では,OCC と WS を統合トレーニングフレームワークに組み込むことにより,ラベルに依存しない教師なし VAD について検討する。
- 参考スコア(独自算出の注目度): 42.127714726268174
- License:
- Abstract: Video Anomaly Detection (VAD) has been extensively studied under the settings of One-Class Classification (OCC) and Weakly-Supervised learning (WS), which however both require laborious human-annotated normal/abnormal labels. In this paper, we study Unsupervised VAD (UVAD) that does not depend on any label by combining OCC and WS into a unified training framework. Specifically, we extend OCC to weighted OCC (wOCC) and propose a wOCC-WS interleaving training module, where the two models automatically generate pseudo-labels for each other. We face two challenges to make the combination effective: (1) Models' performance fluctuates occasionally during the training process due to the inevitable randomness of the pseudo labels. (2) Thresholds are needed to divide pseudo labels, making the training depend on the accuracy of user intervention. For the first problem, we propose to use wOCC requiring soft labels instead of OCC trained with hard zero/one labels, as soft labels exhibit high consistency throughout different training cycles while hard labels are prone to sudden changes. For the second problem, we repeat the interleaving training module multiple times, during which we propose an adaptive thresholding strategy that can progressively refine a rough threshold to a relatively optimal threshold, which reduces the influence of user interaction. A benefit of employing OCC and WS methods to compose a UVAD method is that we can incorporate the most recent OCC or WS model into our framework. Experiments demonstrate the effectiveness of the proposed UVAD framework.
- Abstract(参考訳): ビデオ異常検出(VAD)は、ワンクラス分類(OCC)とウィークリー・スーパービジョンド・ラーニング(WS)の設定の下で広く研究されている。
本稿では OCC と WS を統合トレーニングフレームワークに組み込むことにより,ラベルに依存しない Unsupervised VAD (UVAD) について検討する。
具体的には、OCCを重み付きOCC(wOCC)に拡張し、wOCC-WSインターリービングトレーニングモジュールを提案し、2つのモデルが相互に擬似ラベルを自動生成する。
1)モデルの性能は、擬似ラベルの必然的ランダム性により、トレーニングプロセス中に時折変動する。
2)擬似ラベルの分割には閾値が必要であり,ユーザの介入の正確さに依存している。
最初の問題として、ハードラベルが急激な変化を起こす一方、ソフトラベルは異なるトレーニングサイクルを通して高い一貫性を示すため、ハードゼロ/ワンラベルで訓練されたOCCの代わりにソフトラベルを必要とするwOCCを使うことを提案する。
2つ目の問題として,段階的に粗しきいしきい値を比較的最適なしきい値に改善し,ユーザインタラクションの影響を低減できる適応しきい値設定戦略を提案する。
OCC と WS メソッドを使って UVAD メソッドを構成する利点は、最新の OCC または WS モデルを我々のフレームワークに組み込むことができることです。
提案したUVADフレームワークの有効性を示す実験を行った。
関連論文リスト
- CSOT: Curriculum and Structure-Aware Optimal Transport for Learning with
Noisy Labels [13.807759089431855]
ノイズラベル(LNL)による学習は、十分に一般化されたモデルのトレーニングにおいて重要な課題となる。
近年の進歩は、クリーンなラベルと、トレーニングのための破損したラベルを識別することで、印象的なパフォーマンスを実現している。
我々は、CSOT(Curriculum and Structure-Aware Optimal Transport)と呼ばれる新しい最適輸送(OT)の定式化を提案する。
論文 参考訳(メタデータ) (2023-12-11T09:12:50Z) - Hard-aware Instance Adaptive Self-training for Unsupervised Cross-domain
Semantic Segmentation [18.807921765977415]
セマンティックセグメンテーションの課題に対して,UDAのための適応型自己学習フレームワークを提案する。
我々は,インスタンス適応セレクタを用いた新しい擬似ラベル生成戦略を開発した。
GTA5からCityscapesへ、SynTHIAからCityscapesへ、そしてCityscapesからOxford RobotCarへの実験は、我々のアプローチの優れた性能を実証した。
論文 参考訳(メタデータ) (2023-02-14T11:52:26Z) - Transductive CLIP with Class-Conditional Contrastive Learning [68.51078382124331]
雑音ラベル付き分類ネットワークをスクラッチから学習するための新しいフレームワークであるTransductive CLIPを提案する。
擬似ラベルへの依存を軽減するために,クラス条件のコントラスト学習機構を提案する。
アンサンブルラベルは、ノイズラベル付きディープニューラルネットワークのトレーニングを安定化するための擬似ラベル更新戦略として採用されている。
論文 参考訳(メタデータ) (2022-06-13T14:04:57Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Two-phase Pseudo Label Densification for Self-training based Domain
Adaptation [93.03265290594278]
TPLDと呼ばれる,新規な二相擬似ラベル高密度化フレームワークを提案する。
第1フェーズでは,スライディングウインドウ投票を用いて,画像内の内在的空間相関を利用して,自信のある予測を広める。
第2フェーズでは,信頼度に基づく容易な分類を行う。
トレーニングプロセスの容易化と騒音予測の回避を目的として,ブートストラップ機構の導入を行った。
論文 参考訳(メタデータ) (2020-12-09T02:35:25Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。