論文の概要: Understanding the Challenges and Opportunities of Pose-based Anomaly
Detection
- arxiv url: http://arxiv.org/abs/2303.05463v1
- Date: Thu, 9 Mar 2023 18:09:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-10 13:47:02.831194
- Title: Understanding the Challenges and Opportunities of Pose-based Anomaly
Detection
- Title(参考訳): Pose-based Anomaly Detection の課題と可能性
- Authors: Ghazal Alinezhad Noghre, Armin Danesh Pazho, Vinit Katariya, Hamed
Tabkhi
- Abstract要約: ポーズベースの異常検出(Pose-based anomaly detection)は、ビデオフレームから抽出された人間のポーズを調べることによって、異常な出来事や行動を検出するビデオ分析技術である。
本研究では、ポーズに基づく異常検出の難しさをよりよく理解するために、2つのよく知られたビデオ異常データセットの特徴を分析し、定量化する。
これらの実験は、ポーズベースの異常検出と現在利用可能なデータセットをより理解する上で有益であると考えています。
- 参考スコア(独自算出の注目度): 2.924868086534434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pose-based anomaly detection is a video-analysis technique for detecting
anomalous events or behaviors by examining human pose extracted from the video
frames. Utilizing pose data alleviates privacy and ethical issues. Also,
computation-wise, the complexity of pose-based models is lower than pixel-based
approaches. However, it introduces more challenges, such as noisy skeleton
data, losing important pixel information, and not having enriched enough
features. These problems are exacerbated by a lack of anomaly detection
datasets that are good enough representatives of real-world scenarios. In this
work, we analyze and quantify the characteristics of two well-known video
anomaly datasets to better understand the difficulties of pose-based anomaly
detection. We take a step forward, exploring the discriminating power of pose
and trajectory for video anomaly detection and their effectiveness based on
context. We believe these experiments are beneficial for a better comprehension
of pose-based anomaly detection and the datasets currently available. This will
aid researchers in tackling the task of anomaly detection with a more lucid
perspective, accelerating the development of robust models with better
performance.
- Abstract(参考訳): ポーズに基づく異常検出(英: pose-based anomaly detection)は、映像フレームから抽出された人間のポーズを調べることで異常事象や行動を検出するビデオ解析技術である。
ポーズデータを利用することで、プライバシーや倫理的な問題を軽減できる。
また、計算面では、ポーズベースのモデルの複雑さはピクセルベースのアプローチよりも低い。
しかし、騒がしいスケルトンデータ、重要なピクセル情報を失うこと、機能が不十分なことなど、より多くの課題が導入されている。
これらの問題は、現実世界のシナリオを十分に代表する異常検出データセットの欠如によって悪化する。
本研究では,2つの既知のビデオ異常データセットの特徴を分析し,その特徴を定量化し,ポーズに基づく異常検出の難しさをよりよく理解する。
我々は、ビデオ異常検出のためのポーズと軌跡の識別力とその文脈に基づく有効性について、一歩前進する。
これらの実験は、ポーズベースの異常検出と現在利用可能なデータセットをより理解する上で有益であると考えています。
これは、よりルーシッドな視点で異常検出のタスクに取り組む研究者の助けとなり、より優れたパフォーマンスでロバストなモデルの開発を加速する。
関連論文リスト
- VANE-Bench: Video Anomaly Evaluation Benchmark for Conversational LMMs [64.60035916955837]
VANE-Benchはビデオの異常や矛盾を検出するためのビデオLMMの熟練度を評価するために設計されたベンチマークである。
我々のデータセットは、既存の最先端のテキスト・ビデオ生成モデルを用いて合成された一連のビデオから構成される。
我々は、このベンチマークタスクにおいて、オープンソースとクローズドソースの両方で既存の9つのビデオLMMを評価し、ほとんどのモデルが微妙な異常を効果的に識別するのに困難に直面することを発見した。
論文 参考訳(メタデータ) (2024-06-14T17:59:01Z) - SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection [18.796625355398252]
最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。
本稿では,3次元ガウススプラッティングに基づくフレームワークSplatPoseを提案する。
競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。
論文 参考訳(メタデータ) (2024-04-10T08:48:09Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - PAD: A Dataset and Benchmark for Pose-agnostic Anomaly Detection [28.973078719467516]
我々は,多目的異常検出データセットとPose-Agnostic Anomaly Detectionベンチマークを開発する。
具体的には、さまざまなポーズと、シミュレーションと実環境の両方で高品質で多様な3D異常を持つ20個の複合形状のレゴ玩具を用いて、MADを構築します。
また,ポーズに依存しない異常検出のために,MADを用いて訓練した新しいOmniposeADを提案する。
論文 参考訳(メタデータ) (2023-10-11T17:59:56Z) - Explainable Anomaly Detection in Images and Videos: A Survey [49.07140708026425]
画像やビデオを含む視覚データの異常検出とローカライゼーションは、機械学習のアカデミックと実世界のシナリオの適用において非常に重要である。
近年の視覚異常検出技術の急速な発展にもかかわらず、これらのブラックボックスモデルの解釈や、なぜ異常を区別できるのかの合理的な説明は乏しい。
本稿では,説明可能な視覚異常検出法に焦点をあてた最初の調査を行う。
論文 参考訳(メタデータ) (2023-02-13T20:17:41Z) - CHAD: Charlotte Anomaly Dataset [2.6774008509840996]
ビデオ異常検出のためのシャーロット異常データセット(CHAD)を提案する。
CHADはバウンディングボックス、アイデンティティ、各アクターのアノテーションを含む最初の異常データセットである。
4つのカメラビューと115万フレーム以上を持つCHADは、完全注釈付き異常検出データセットとしては最大である。
論文 参考訳(メタデータ) (2022-12-19T06:05:34Z) - An Outlier Exposure Approach to Improve Visual Anomaly Detection
Performance for Mobile Robots [76.36017224414523]
移動ロボットの視覚異常検出システム構築の問題点を考察する。
標準異常検出モデルは、非異常データのみからなる大規模なデータセットを用いて訓練される。
本研究では,これらのデータを利用してリアルNVP異常検出モデルの性能向上を図る。
論文 参考訳(メタデータ) (2022-09-20T15:18:13Z) - Anomalous entities detection using a cascade of deep learning models [2.9005223064604078]
本稿では,試験ホールの複雑な状況において異常を検知する新しい手法を提案する。
提案手法は,深層畳み込みニューラルネットワークモデルのカスケードを用いる。
提案手法は異常な物体を検知し,異常な挙動を高精度に保証できることを示す。
論文 参考訳(メタデータ) (2021-03-09T01:23:19Z) - Video Anomaly Detection by Estimating Likelihood of Representations [21.879366166261228]
ビデオ異常は、モーション表現、オブジェクトのローカライゼーション、アクション認識など、多くのサブタスクを解決するため、困難なタスクである。
伝統的に、この課題に対する解決策は、これらの特徴の空間的接続を無視しながら、ビデオフレームとその低次元特徴のマッピングに焦点を当ててきた。
最近のソリューションでは、K-Meansのようなハードクラスタリング技術を用いてこれらの空間的接続を分析することや、潜伏した特徴を一般的な理解にマップするためにニューラルネットワークを適用することに焦点を当てている。
潜在特徴空間における映像異常を解決するために,このタスクを密度推定問題に転送するための深い確率モデルを提案する。
論文 参考訳(メタデータ) (2020-12-02T19:16:22Z) - VideoForensicsHQ: Detecting High-quality Manipulated Face Videos [77.60295082172098]
偽造検知器の性能は、人間の目で見られる人工物の存在にどのように依存するかを示す。
前例のない品質の顔ビデオ偽造検出のための新しいベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2020-05-20T21:17:43Z) - Self-trained Deep Ordinal Regression for End-to-End Video Anomaly
Detection [114.9714355807607]
ビデオ異常検出に自己学習深層順序回帰を適用することで,既存の手法の2つの重要な限界を克服できることを示す。
我々は,手動で正規/異常データをラベル付けすることなく,共同表現学習と異常スコアリングを可能にする,エンドツーエンドのトレーニング可能なビデオ異常検出手法を考案した。
論文 参考訳(メタデータ) (2020-03-15T08:44:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。