論文の概要: Locality-aware Attention Network with Discriminative Dynamics Learning
for Weakly Supervised Anomaly Detection
- arxiv url: http://arxiv.org/abs/2208.05636v1
- Date: Thu, 11 Aug 2022 04:27:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-12 13:20:05.826493
- Title: Locality-aware Attention Network with Discriminative Dynamics Learning
for Weakly Supervised Anomaly Detection
- Title(参考訳): 弱教師付き異常検出のための識別ダイナミクス学習を用いた局所性認識型注意ネットワーク
- Authors: Yujiang Pu, Xiaoyu Wu
- Abstract要約: 本稿では,2つの目的関数,すなわち動的ランク付け損失と動的アライメント損失の識別的ダイナミクス学習(DDL)手法を提案する。
局所性認識型注意ネットワーク(LA-Net)は,大域的相関を捉え,スニペット間の位置選好を補正するために構築され,その後,因果畳み込みを伴う多層パーセプトロンにより異常スコアを得る。
- 参考スコア(独自算出の注目度): 0.8883733362171035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video anomaly detection is recently formulated as a multiple instance
learning task under weak supervision, in which each video is treated as a bag
of snippets to be determined whether contains anomalies. Previous efforts
mainly focus on the discrimination of the snippet itself without modeling the
temporal dynamics, which refers to the variation of adjacent snippets.
Therefore, we propose a Discriminative Dynamics Learning (DDL) method with two
objective functions, i.e., dynamics ranking loss and dynamics alignment loss.
The former aims to enlarge the score dynamics gap between positive and negative
bags while the latter performs temporal alignment of the feature dynamics and
score dynamics within the bag. Moreover, a Locality-aware Attention Network
(LA-Net) is constructed to capture global correlations and re-calibrate the
location preference across snippets, followed by a multilayer perceptron with
causal convolution to obtain anomaly scores. Experimental results show that our
method achieves significant improvements on two challenging benchmarks, i.e.,
UCF-Crime and XD-Violence.
- Abstract(参考訳): ビデオ異常検出は、最近、弱監督下で複数のインスタンス学習タスクとして定式化され、各ビデオは、異常を含むか否かを決定するスニペットの袋として扱われる。
それまでの取り組みは主に、隣接するスニペットの変動を参照する時間的ダイナミクスをモデル化することなく、スニペット自体の識別に重点を置いていた。
そこで本研究では,2つの目的関数,すなわち動的ランク付け損失と動的アライメント損失の識別的ダイナミクス学習(DDL)手法を提案する。
前者は正の袋と負の袋の間のスコアのダイナミクスギャップを拡大し、後者はバッグ内の特徴のダイナミクスとスコアのダイナミクスを時間的にアライメントすることを目指している。
さらに, 局所性認識型注意ネットワーク(LA-Net)を構築し, グローバルな相関を捉え, スニペット間の位置嗜好を補正し, 因果畳み込みを伴う多層パーセプトロンで異常スコアを得る。
実験の結果,UCF-Crime と XD-Violence の2つのベンチマークにおいて,本手法が大幅な改善を達成していることがわかった。
関連論文リスト
- MGFN: Magnitude-Contrastive Glance-and-Focus Network for
Weakly-Supervised Video Anomaly Detection [39.923871347007875]
そこで本稿では,空間時間情報を統合して高精度な異常検出を行う新しい視点・焦点ネットワークを提案する。
異常の程度を表すために特徴量を使用する既存のアプローチは、通常、シーンのバリエーションの影響を無視する。
本稿では,異常検出のための特徴量の識別性を高めるため,特徴増幅機構とマグニチュードコントラスト損失を提案する。
論文 参考訳(メタデータ) (2022-11-28T07:10:36Z) - Layer-wise Shared Attention Network on Dynamical System Perspective [69.45492795788167]
本稿では,複数のネットワーク層にまたがって単一の注目モジュールを共有するDIAユニットという,新規かつ簡易なフレームワークを提案する。
当社のフレームワークでは,パラメータコストはレイヤ数とは無関係であり,既存の自己注意モジュールの精度をさらに向上する。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Learning Dynamics and Generalization in Reinforcement Learning [59.530058000689884]
時間差学習は, エージェントが訓練の初期段階において, 値関数の非平滑成分を適合させるのに役立つことを理論的に示す。
本研究では,高密度報酬タスクの時間差アルゴリズムを用いて学習したニューラルネットワークが,ランダムなネットワークや政策手法で学習した勾配ネットワークよりも,状態間の一般化が弱いことを示す。
論文 参考訳(メタデータ) (2022-06-05T08:49:16Z) - Fine-grained Temporal Contrastive Learning for Weakly-supervised
Temporal Action Localization [87.47977407022492]
本稿では,シーケンス・ツー・シーケンスの区別を文脈的に比較することで学習が,弱い教師付き行動の局所化に不可欠な帰納的バイアスをもたらすことを論じる。
微分可能な動的プログラミングの定式化の下では、FSD(Fen-fine Sequence Distance)とLCS(Longest Common Subsequence)の2つの相補的コントラストが設計されている。
提案手法は,2つのベンチマークにおいて最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-03-31T05:13:50Z) - Self-Regulated Learning for Egocentric Video Activity Anticipation [147.9783215348252]
自己制御学習(SRL)は、中間表現を連続的に制御し、現在のタイムスタンプのフレームにおける新しい情報を強調する表現を作り出すことを目的としている。
SRLは2つのエゴセントリックなビデオデータセットと2つの第三者のビデオデータセットにおいて、既存の最先端技術よりも大幅に優れています。
論文 参考訳(メタデータ) (2021-11-23T03:29:18Z) - Instance-Level Relative Saliency Ranking with Graph Reasoning [126.09138829920627]
そこで本研究では,有意な事例を分割し,相対的有意な有意なランク順序を推定するための統一モデルを提案する。
また、サラレンシーランキングブランチを効果的にトレーニングするために、新しい損失関数も提案されている。
実験の結果,提案手法は従来の手法よりも有効であることがわかった。
論文 参考訳(メタデータ) (2021-07-08T13:10:42Z) - Modulating Localization and Classification for Harmonized Object
Detection [40.82723262074911]
2つのタスクを変調する相互学習フレームワークを提案する。
特に,2つのタスクは,新たな相互ラベル付け戦略によって互いに学習することを余儀なくされる。
COCOデータセットのベースライン検出器に対する大幅なパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2021-03-16T10:36:02Z) - Hierarchically Decoupled Spatial-Temporal Contrast for Self-supervised
Video Representation Learning [6.523119805288132]
a) 学習対象を2つの対照的なサブタスクに分解し、空間的特徴と時間的特徴を強調し、(b) 階層的にそれを実行し、マルチスケールな理解を促進する。
論文 参考訳(メタデータ) (2020-11-23T08:05:39Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。