Fugu-MT 論文翻訳(概要): Interleaving One-Class and Weakly-Supervised Models with Adaptive Thresholding for Unsupervised Video Anomaly Detection

論文の概要: Interleaving One-Class and Weakly-Supervised Models with Adaptive Thresholding for Unsupervised Video Anomaly Detection

arxiv url: http://arxiv.org/abs/2401.13551v1
Date: Wed, 24 Jan 2024 16:11:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-25 14:05:31.987743
Title: Interleaving One-Class and Weakly-Supervised Models with Adaptive Thresholding for Unsupervised Video Anomaly Detection
Title（参考訳）: 非教師なしビデオ異常検出のための適応しきい値付き一級・弱教師付きモデル
Authors: Yongwei Nie, Hao Huang, Chengjiang Long, Qing Zhang, Pradipta Maji, Hongmin Cai
Abstract要約: 典型的なUnsupervised Video Anomaly Detection (UVAD) 法では、互いに擬似ラベルを生成する2つのモデルを訓練する必要がある。 UVADのためのワンクラス分類(OCC)モデルとWakly-Supervised(WS)モデルを交互に訓練する新しいインターリーブドフレームワークを提案する。提案手法が従来の手法より優れていることを示す実験を行った。
参考スコア（独自算出の注目度）: 44.63919304001732
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Without human annotations, a typical Unsupervised Video Anomaly Detection (UVAD) method needs to train two models that generate pseudo labels for each other. In previous work, the two models are closely entangled with each other, and it is not known how to upgrade their method without modifying their training framework significantly. Second, previous work usually adopts fixed thresholding to obtain pseudo labels, however the user-specified threshold is not reliable which inevitably introduces errors into the training process. To alleviate these two problems, we propose a novel interleaved framework that alternately trains a One-Class Classification (OCC) model and a Weakly-Supervised (WS) model for UVAD. The OCC or WS models in our method can be easily replaced with other OCC or WS models, which facilitates our method to upgrade with the most recent developments in both fields. For handling the fixed thresholding problem, we break through the conventional cognitive boundary and propose a weighted OCC model that can be trained on both normal and abnormal data. We also propose an adaptive mechanism for automatically finding the optimal threshold for the WS model in a loose to strict manner. Experiments demonstrate that the proposed UVAD method outperforms previous approaches.
Abstract（参考訳）: 人間のアノテーションがなければ、典型的なUnsupervised Video Anomaly Detection (UVAD) 法では、互いに擬似ラベルを生成する2つのモデルを訓練する必要がある。前回の作業では、2つのモデルが密接に絡み合っており、トレーニングフレームワークを大幅に変更することなく、どのようにメソッドをアップグレードするかは分かっていない。第2に、従来の作業では固定しきい値を採用して擬似ラベルを取得するが、ユーザ指定しきい値が信頼できないため、必然的にトレーニングプロセスにエラーが発生する。これら2つの問題を緩和するために,1クラス分類(OCC)モデルとWakly-Supervised(WS)モデルを交互にトレーニングする新しいインターリーブドフレームワークを提案する。私たちのメソッドの OCC または WS モデルは、他の OCC または WS モデルに簡単に置き換えることができる。固定しきい値問題に対処するために,従来の認知境界を破って,正常データと異常データの両方でトレーニング可能な重み付きoccモデルを提案する。また、WSモデルの最適しきい値を自動的にゆるやかな方法で見つけるための適応的なメカニズムを提案する。提案手法が従来の手法より優れていることを示す実験を行った。

関連論文リスト

DART: Dual Adaptive Refinement Transfer for Open-Vocabulary Multi-Label Recognition [59.203152078315235]
Open-Vocabulary Multi-Label Recognition (OV-MLR)は、画像内の複数の見えないオブジェクトカテゴリを識別することを目的としている。ビジョンランゲージ事前学習モデルは強力なオープン語彙基盤を提供するが、弱い監督下では微粒な局所化に苦慮する。本稿では,これらの制約を克服するためのDART(Dual Adaptive Refinement Transfer)フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-07T17:22:33Z)
Towards Fine-Grained Adaptation of CLIP via a Self-Trained Alignment Score [11.74414842618874]
適応中の微粒な相互モーダル相互作用をモデル化すると、より正確でクラス別な擬似ラベルが得られることを示す。局所化画像特徴と記述言語埋め込みとを動的に整合させる革新的なアプローチであるFAIR(ファインフルアライメント・アンド・インタラクション・リファインメント)を導入する。当社のアプローチであるFAIRは、きめ細かな教師なし適応において大幅なパフォーマンス向上を実現し、2.78%という顕著な全体的な向上を実現しています。
論文参考訳（メタデータ） (2025-07-13T12:38:38Z)
Unsupervised Domain Adaptation with Dynamic Clustering and Contrastive Refinement for Gait Recognition [10.764553749977674]
歩行認識は、個人の歩行パターンを分析することによって、遠くにいる個人を識別する新興技術である。近年,クラスタリングに基づく教師なし領域適応手法を用いて,教師なし歩行認識について検討している。本稿では,クラスタリングとモデルトレーニングにおけるノイズの多い擬似ラベルの影響を低減することを目的とした,GaitD CCRと呼ばれる新しいモデルを提案する。
論文参考訳（メタデータ） (2025-01-28T00:55:07Z)
CSOT: Curriculum and Structure-Aware Optimal Transport for Learning with Noisy Labels [13.807759089431855]
ノイズラベル(LNL)による学習は、十分に一般化されたモデルのトレーニングにおいて重要な課題となる。近年の進歩は、クリーンなラベルと、トレーニングのための破損したラベルを識別することで、印象的なパフォーマンスを実現している。我々は、CSOT(Curriculum and Structure-Aware Optimal Transport)と呼ばれる新しい最適輸送(OT)の定式化を提案する。
論文参考訳（メタデータ） (2023-12-11T09:12:50Z)
Hard-aware Instance Adaptive Self-training for Unsupervised Cross-domain Semantic Segmentation [18.807921765977415]
セマンティックセグメンテーションの課題に対して,UDAのための適応型自己学習フレームワークを提案する。我々は,インスタンス適応セレクタを用いた新しい擬似ラベル生成戦略を開発した。 GTA5からCityscapesへ、SynTHIAからCityscapesへ、そしてCityscapesからOxford RobotCarへの実験は、我々のアプローチの優れた性能を実証した。
論文参考訳（メタデータ） (2023-02-14T11:52:26Z)
Transductive CLIP with Class-Conditional Contrastive Learning [68.51078382124331]
雑音ラベル付き分類ネットワークをスクラッチから学習するための新しいフレームワークであるTransductive CLIPを提案する。擬似ラベルへの依存を軽減するために,クラス条件のコントラスト学習機構を提案する。アンサンブルラベルは、ノイズラベル付きディープニューラルネットワークのトレーニングを安定化するための擬似ラベル更新戦略として採用されている。
論文参考訳（メタデータ） (2022-06-13T14:04:57Z)
A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文参考訳（メタデータ） (2022-02-08T19:18:49Z)
Activation to Saliency: Forming High-Quality Labels for Unsupervised Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文参考訳（メタデータ） (2021-12-07T11:54:06Z)
Two-phase Pseudo Label Densification for Self-training based Domain Adaptation [93.03265290594278]
TPLDと呼ばれる,新規な二相擬似ラベル高密度化フレームワークを提案する。第1フェーズでは,スライディングウインドウ投票を用いて,画像内の内在的空間相関を利用して,自信のある予測を広める。第2フェーズでは,信頼度に基づく容易な分類を行う。トレーニングプロセスの容易化と騒音予測の回避を目的として,ブートストラップ機構の導入を行った。
論文参考訳（メタデータ） (2020-12-09T02:35:25Z)
Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。 3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文参考訳（メタデータ） (2020-07-21T14:31:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。