論文の概要: Multi-Task Learning based Video Anomaly Detection with Attention
- arxiv url: http://arxiv.org/abs/2210.07697v2
- Date: Thu, 11 May 2023 13:41:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-12 18:49:08.478543
- Title: Multi-Task Learning based Video Anomaly Detection with Attention
- Title(参考訳): 注意を伴うマルチタスク学習に基づくビデオ異常検出
- Authors: Mohammad Baradaran and Robert Bergevin
- Abstract要約: 本稿では,動作と外観をよりよく考慮するために,補完的なプロキシタスクを組み合わせた新しいマルチタスク学習手法を提案する。
我々は1つのブランチにおけるセマンティックセグメンテーションと将来のフレーム予測タスクを組み合わせて、オブジェクトクラスと一貫した動作パターンを学習する。
第2枝では、対象部位、動き方向、カメラからの物体の距離に注意を向けた動き異常を検出するためのいくつかの注意機構を付加した。
- 参考スコア(独自算出の注目度): 1.2944868613449219
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-task learning based video anomaly detection methods combine multiple
proxy tasks in different branches to detect video anomalies in different
situations. Most existing methods either do not combine complementary tasks to
effectively cover all motion patterns, or the class of the objects is not
explicitly considered. To address the aforementioned shortcomings, we propose a
novel multi-task learning based method that combines complementary proxy tasks
to better consider the motion and appearance features. We combine the semantic
segmentation and future frame prediction tasks in a single branch to learn the
object class and consistent motion patterns, and to detect respective anomalies
simultaneously. In the second branch, we added several attention mechanisms to
detect motion anomalies with attention to object parts, the direction of
motion, and the distance of the objects from the camera. Our qualitative
results show that the proposed method considers the object class effectively
and learns motion with attention to the aforementioned important factors which
results in a precise motion modeling and a better motion anomaly detection.
Additionally, quantitative results show the superiority of our method compared
with state-of-the-art methods.
- Abstract(参考訳): マルチタスク学習に基づくビデオ異常検出手法は、異なるブランチ内の複数のプロキシタスクを組み合わせて、異なる状況でビデオ異常を検出する。
既存のほとんどのメソッドは、すべての動作パターンを効果的にカバーするために補完的なタスクを結合しないか、オブジェクトのクラスを明示的に考慮していない。
上記の欠点に対処するために,相補的なプロキシタスクを組み合わせたマルチタスク学習に基づく新しい手法を提案する。
セマンティクスセグメンテーションと将来のフレーム予測タスクを1つのブランチで組み合わせ、オブジェクトクラスと一貫した動きパターンを学習し、それぞれの異常を同時に検出する。
第2のブランチでは,物体に注目する動き異常,動き方向,カメラからの物体の距離を検出するための注意機構をいくつか追加した。
その結果,提案手法は物体クラスを効果的に考慮し,上述の重要な要素に注目して動作を学習し,より正確な動作モデルとより優れた動作異常検出を実現する。
さらに,本手法が最先端手法よりも優れていることを示す。
関連論文リスト
- Multi-view Action Recognition via Directed Gromov-Wasserstein Discrepancy [12.257725479880458]
行動認識はコンピュータビジョンにおける人気のある研究トピックの1つとなっている。
本稿では,アクションビデオの2つの異なる視点から2つの注意の類似性を計算する多視点アテンション整合性手法を提案する。
我々のアプローチでは、単一ビューデータセットのトレーニングにおいて、新しいビューからの機能を暗黙的にレンダリングするために、Neural Radiance Fieldというアイデアを適用しています。
論文 参考訳(メタデータ) (2024-05-02T14:43:21Z) - SeMAIL: Eliminating Distractors in Visual Imitation via Separated Models [22.472167814814448]
本稿では,SeMAIL(Separated Model-based Adversarial Imitation Learning)というモデルベース模倣学習アルゴリズムを提案する。
本手法は, 様々な視覚的制御タスクにおいて, 複雑な観察と, 専門的な観察から異なる背景を持つより困難なタスクにおいて, ほぼ専門的な性能を実現する。
論文 参考訳(メタデータ) (2023-06-19T04:33:44Z) - Visual Exemplar Driven Task-Prompting for Unified Perception in
Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。
具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。
我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文 参考訳(メタデータ) (2023-03-03T08:54:06Z) - Multi-Task Learning of Object State Changes from Uncurated Videos [55.60442251060871]
我々は、長い未処理のウェブビデオにおいて、オブジェクトと対話する人々を観察することで、オブジェクトの状態変化を時間的にローカライズすることを学ぶ。
マルチタスクモデルでは,従来のシングルタスク手法に比べて40%の相対的な改善が達成されている。
また,EPIC-KITCHENSとEgo4Dデータセットを0ショット設定で長時間遠心分離したビデオでテストした。
論文 参考訳(メタデータ) (2022-11-24T09:42:46Z) - SSMTL++: Revisiting Self-Supervised Multi-Task Learning for Video
Anomaly Detection [108.57862846523858]
自己教師型マルチタスク学習フレームワークを再考し、元の手法にいくつかのアップデートを提案する。
マルチヘッド・セルフアテンション・モジュールを導入することで3次元畳み込みバックボーンを近代化する。
モデルをさらに改良するために,セグメントマップの予測などの自己指導型学習タスクについて検討した。
論文 参考訳(メタデータ) (2022-07-16T19:25:41Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z) - Masked Contrastive Learning for Anomaly Detection [10.499890749386676]
マスク型コントラスト学習という,タスク固有のコントラスト学習のバリエーションを提案する。
また,自己アンサンブル推論と呼ばれる新しい推論手法を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:27:02Z) - Video Relation Detection with Trajectory-aware Multi-modal Features [13.358584829993193]
本稿では,軌道認識型マルチモーダル特徴を用いた映像関係検出手法を提案する。
ACM Multimedia 2020におけるビデオ関係理解グランドチャレンジのビデオ関係検出タスクにおいて,11.74% mAPで優勝した。
論文 参考訳(メタデータ) (2021-01-20T14:49:02Z) - Anomaly Detection in Video via Self-Supervised and Multi-Task Learning [113.81927544121625]
ビデオにおける異常検出は、コンピュータビジョンの問題である。
本稿では,オブジェクトレベルでの自己教師型およびマルチタスク学習を通じて,ビデオ中の異常事象検出にアプローチする。
論文 参考訳(メタデータ) (2020-11-15T10:21:28Z) - Adaptive Object Detection with Dual Multi-Label Prediction [78.69064917947624]
本稿では,適応オブジェクト検出のための新しいエンド・ツー・エンドの非教師付き深部ドメイン適応モデルを提案する。
モデルはマルチラベル予測を利用して、各画像内の対象カテゴリ情報を明らかにする。
本稿では,オブジェクト検出を支援するための予測整合正則化機構を提案する。
論文 参考訳(メタデータ) (2020-03-29T04:23:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。