Fugu-MT 論文翻訳(概要): Locality-aware Attention Network with Discriminative Dynamics Learning for Weakly Supervised Anomaly Detection

論文の概要: Locality-aware Attention Network with Discriminative Dynamics Learning for Weakly Supervised Anomaly Detection

arxiv url: http://arxiv.org/abs/2208.05636v1
Date: Thu, 11 Aug 2022 04:27:33 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-12 13:20:05.826493
Title: Locality-aware Attention Network with Discriminative Dynamics Learning for Weakly Supervised Anomaly Detection
Title（参考訳）: 弱教師付き異常検出のための識別ダイナミクス学習を用いた局所性認識型注意ネットワーク
Authors: Yujiang Pu, Xiaoyu Wu
Abstract要約: 本稿では,2つの目的関数,すなわち動的ランク付け損失と動的アライメント損失の識別的ダイナミクス学習(DDL)手法を提案する。局所性認識型注意ネットワーク(LA-Net)は,大域的相関を捉え,スニペット間の位置選好を補正するために構築され,その後,因果畳み込みを伴う多層パーセプトロンにより異常スコアを得る。
参考スコア（独自算出の注目度）: 0.8883733362171035
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Video anomaly detection is recently formulated as a multiple instance learning task under weak supervision, in which each video is treated as a bag of snippets to be determined whether contains anomalies. Previous efforts mainly focus on the discrimination of the snippet itself without modeling the temporal dynamics, which refers to the variation of adjacent snippets. Therefore, we propose a Discriminative Dynamics Learning (DDL) method with two objective functions, i.e., dynamics ranking loss and dynamics alignment loss. The former aims to enlarge the score dynamics gap between positive and negative bags while the latter performs temporal alignment of the feature dynamics and score dynamics within the bag. Moreover, a Locality-aware Attention Network (LA-Net) is constructed to capture global correlations and re-calibrate the location preference across snippets, followed by a multilayer perceptron with causal convolution to obtain anomaly scores. Experimental results show that our method achieves significant improvements on two challenging benchmarks, i.e., UCF-Crime and XD-Violence.
Abstract（参考訳）: ビデオ異常検出は、最近、弱監督下で複数のインスタンス学習タスクとして定式化され、各ビデオは、異常を含むか否かを決定するスニペットの袋として扱われる。それまでの取り組みは主に、隣接するスニペットの変動を参照する時間的ダイナミクスをモデル化することなく、スニペット自体の識別に重点を置いていた。そこで本研究では,2つの目的関数,すなわち動的ランク付け損失と動的アライメント損失の識別的ダイナミクス学習(DDL)手法を提案する。前者は正の袋と負の袋の間のスコアのダイナミクスギャップを拡大し、後者はバッグ内の特徴のダイナミクスとスコアのダイナミクスを時間的にアライメントすることを目指している。さらに, 局所性認識型注意ネットワーク(LA-Net)を構築し, グローバルな相関を捉え, スニペット間の位置嗜好を補正し, 因果畳み込みを伴う多層パーセプトロンで異常スコアを得る。実験の結果,UCF-Crime と XD-Violence の2つのベンチマークにおいて,本手法が大幅な改善を達成していることがわかった。

関連論文リスト

Dynamic Attention Analysis for Backdoor Detection in Text-to-Image Diffusion Models [70.03122709795122]
従来のバックドア検出手法は主にバックドアサンプルの静的特徴に焦点を当てていた。本研究では、動的注意分析(DEA)と呼ばれる新しいバックドア検出視点を導入し、これらの動的特徴がバックドア検出の指標となることを示す。我々の手法は既存の検出方法を大きく上回り、平均F1スコアは79.49%、AUCは87.67%に達した。
論文参考訳（メタデータ） (2025-04-29T07:59:35Z)
Action Quality Assessment via Hierarchical Pose-guided Multi-stage Contrastive Regression [25.657978409890973]
アクションアセスメント(AQA)は、運動性能の自動的、公平な評価を目的としている。現在の手法では、動画を固定フレームに分割することに集中しており、サブアクションの時間的連続性を損なう。階層的なポーズ誘導型多段階コントラスト回帰による行動品質評価手法を提案する。
論文参考訳（メタデータ） (2025-01-07T10:20:16Z)
Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.38330727868982]
双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。 BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文参考訳（メタデータ） (2024-08-30T15:39:34Z)
Learn to Memorize and to Forget: A Continual Learning Perspective of Dynamic SLAM [17.661231232206028]
暗黙的な神経表現を伴う同時局所化とマッピング(SLAM)が注目されている。動的環境のための新しいSLAMフレームワークを提案する。
論文参考訳（メタデータ） (2024-07-18T09:35:48Z)
Dynamic Distinction Learning: Adaptive Pseudo Anomalies for Video Anomaly Detection [8.957579200590985]
ビデオ異常検出のための動的識別学習(DDL)を提案する。 DDLは擬似異常、動的異常重み付け、識別損失関数を組み合わせて検出精度を向上させる。本手法は, 異常しきい値の固定を伴わずに, 正常および異常な挙動の変動に適応する。
論文参考訳（メタデータ） (2024-04-07T15:06:48Z)
Learning Dynamics and Generalization in Reinforcement Learning [59.530058000689884]
時間差学習は, エージェントが訓練の初期段階において, 値関数の非平滑成分を適合させるのに役立つことを理論的に示す。本研究では,高密度報酬タスクの時間差アルゴリズムを用いて学習したニューラルネットワークが,ランダムなネットワークや政策手法で学習した勾配ネットワークよりも,状態間の一般化が弱いことを示す。
論文参考訳（メタデータ） (2022-06-05T08:49:16Z)
Fine-grained Temporal Contrastive Learning for Weakly-supervised Temporal Action Localization [87.47977407022492]
本稿では,シーケンス・ツー・シーケンスの区別を文脈的に比較することで学習が,弱い教師付き行動の局所化に不可欠な帰納的バイアスをもたらすことを論じる。微分可能な動的プログラミングの定式化の下では、FSD(Fen-fine Sequence Distance)とLCS(Longest Common Subsequence)の2つの相補的コントラストが設計されている。提案手法は,2つのベンチマークにおいて最先端の性能を実現する。
論文参考訳（メタデータ） (2022-03-31T05:13:50Z)
Self-Regulated Learning for Egocentric Video Activity Anticipation [147.9783215348252]
自己制御学習(SRL)は、中間表現を連続的に制御し、現在のタイムスタンプのフレームにおける新しい情報を強調する表現を作り出すことを目的としている。 SRLは2つのエゴセントリックなビデオデータセットと2つの第三者のビデオデータセットにおいて、既存の最先端技術よりも大幅に優れています。
論文参考訳（メタデータ） (2021-11-23T03:29:18Z)
Instance-Level Relative Saliency Ranking with Graph Reasoning [126.09138829920627]
そこで本研究では,有意な事例を分割し,相対的有意な有意なランク順序を推定するための統一モデルを提案する。また、サラレンシーランキングブランチを効果的にトレーニングするために、新しい損失関数も提案されている。実験の結果,提案手法は従来の手法よりも有効であることがわかった。
論文参考訳（メタデータ） (2021-07-08T13:10:42Z)
Modulating Localization and Classification for Harmonized Object Detection [40.82723262074911]
2つのタスクを変調する相互学習フレームワークを提案する。特に,2つのタスクは,新たな相互ラベル付け戦略によって互いに学習することを余儀なくされる。 COCOデータセットのベースライン検出器に対する大幅なパフォーマンス向上を実現しました。
論文参考訳（メタデータ） (2021-03-16T10:36:02Z)
Hierarchically Decoupled Spatial-Temporal Contrast for Self-supervised Video Representation Learning [6.523119805288132]
a) 学習対象を2つの対照的なサブタスクに分解し、空間的特徴と時間的特徴を強調し、(b) 階層的にそれを実行し、マルチスケールな理解を促進する。
論文参考訳（メタデータ） (2020-11-23T08:05:39Z)
Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。 5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文参考訳（メタデータ） (2020-07-17T15:41:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。