論文の概要: Interleaving One-Class and Weakly-Supervised Models with Adaptive
Thresholding for Unsupervised Video Anomaly Detection
- arxiv url: http://arxiv.org/abs/2401.13551v1
- Date: Wed, 24 Jan 2024 16:11:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-25 14:05:31.987743
- Title: Interleaving One-Class and Weakly-Supervised Models with Adaptive
Thresholding for Unsupervised Video Anomaly Detection
- Title(参考訳): 非教師なしビデオ異常検出のための適応しきい値付き一級・弱教師付きモデル
- Authors: Yongwei Nie, Hao Huang, Chengjiang Long, Qing Zhang, Pradipta Maji,
Hongmin Cai
- Abstract要約: 典型的なUnsupervised Video Anomaly Detection (UVAD) 法では、互いに擬似ラベルを生成する2つのモデルを訓練する必要がある。
UVADのためのワンクラス分類(OCC)モデルとWakly-Supervised(WS)モデルを交互に訓練する新しいインターリーブドフレームワークを提案する。
提案手法が従来の手法より優れていることを示す実験を行った。
- 参考スコア(独自算出の注目度): 44.63919304001732
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Without human annotations, a typical Unsupervised Video Anomaly Detection
(UVAD) method needs to train two models that generate pseudo labels for each
other. In previous work, the two models are closely entangled with each other,
and it is not known how to upgrade their method without modifying their
training framework significantly. Second, previous work usually adopts fixed
thresholding to obtain pseudo labels, however the user-specified threshold is
not reliable which inevitably introduces errors into the training process. To
alleviate these two problems, we propose a novel interleaved framework that
alternately trains a One-Class Classification (OCC) model and a
Weakly-Supervised (WS) model for UVAD. The OCC or WS models in our method can
be easily replaced with other OCC or WS models, which facilitates our method to
upgrade with the most recent developments in both fields. For handling the
fixed thresholding problem, we break through the conventional cognitive
boundary and propose a weighted OCC model that can be trained on both normal
and abnormal data. We also propose an adaptive mechanism for automatically
finding the optimal threshold for the WS model in a loose to strict manner.
Experiments demonstrate that the proposed UVAD method outperforms previous
approaches.
- Abstract(参考訳): 人間のアノテーションがなければ、典型的なUnsupervised Video Anomaly Detection (UVAD) 法では、互いに擬似ラベルを生成する2つのモデルを訓練する必要がある。
前回の作業では、2つのモデルが密接に絡み合っており、トレーニングフレームワークを大幅に変更することなく、どのようにメソッドをアップグレードするかは分かっていない。
第2に、従来の作業では固定しきい値を採用して擬似ラベルを取得するが、ユーザ指定しきい値が信頼できないため、必然的にトレーニングプロセスにエラーが発生する。
これら2つの問題を緩和するために,1クラス分類(OCC)モデルとWakly-Supervised(WS)モデルを交互にトレーニングする新しいインターリーブドフレームワークを提案する。
私たちのメソッドの OCC または WS モデルは、他の OCC または WS モデルに簡単に置き換えることができる。
固定しきい値問題に対処するために,従来の認知境界を破って,正常データと異常データの両方でトレーニング可能な重み付きoccモデルを提案する。
また、WSモデルの最適しきい値を自動的にゆるやかな方法で見つけるための適応的なメカニズムを提案する。
提案手法が従来の手法より優れていることを示す実験を行った。
関連論文リスト
- CSOT: Curriculum and Structure-Aware Optimal Transport for Learning with
Noisy Labels [13.807759089431855]
ノイズラベル(LNL)による学習は、十分に一般化されたモデルのトレーニングにおいて重要な課題となる。
近年の進歩は、クリーンなラベルと、トレーニングのための破損したラベルを識別することで、印象的なパフォーマンスを実現している。
我々は、CSOT(Curriculum and Structure-Aware Optimal Transport)と呼ばれる新しい最適輸送(OT)の定式化を提案する。
論文 参考訳(メタデータ) (2023-12-11T09:12:50Z) - Hard-aware Instance Adaptive Self-training for Unsupervised Cross-domain
Semantic Segmentation [18.807921765977415]
セマンティックセグメンテーションの課題に対して,UDAのための適応型自己学習フレームワークを提案する。
我々は,インスタンス適応セレクタを用いた新しい擬似ラベル生成戦略を開発した。
GTA5からCityscapesへ、SynTHIAからCityscapesへ、そしてCityscapesからOxford RobotCarへの実験は、我々のアプローチの優れた性能を実証した。
論文 参考訳(メタデータ) (2023-02-14T11:52:26Z) - Transductive CLIP with Class-Conditional Contrastive Learning [68.51078382124331]
雑音ラベル付き分類ネットワークをスクラッチから学習するための新しいフレームワークであるTransductive CLIPを提案する。
擬似ラベルへの依存を軽減するために,クラス条件のコントラスト学習機構を提案する。
アンサンブルラベルは、ノイズラベル付きディープニューラルネットワークのトレーニングを安定化するための擬似ラベル更新戦略として採用されている。
論文 参考訳(メタデータ) (2022-06-13T14:04:57Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Two-phase Pseudo Label Densification for Self-training based Domain
Adaptation [93.03265290594278]
TPLDと呼ばれる,新規な二相擬似ラベル高密度化フレームワークを提案する。
第1フェーズでは,スライディングウインドウ投票を用いて,画像内の内在的空間相関を利用して,自信のある予測を広める。
第2フェーズでは,信頼度に基づく容易な分類を行う。
トレーニングプロセスの容易化と騒音予測の回避を目的として,ブートストラップ機構の導入を行った。
論文 参考訳(メタデータ) (2020-12-09T02:35:25Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。