論文の概要: VADTree: Explainable Training-Free Video Anomaly Detection via Hierarchical Granularity-Aware Tree
- arxiv url: http://arxiv.org/abs/2510.22693v2
- Date: Tue, 28 Oct 2025 16:57:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 13:20:32.892735
- Title: VADTree: Explainable Training-Free Video Anomaly Detection via Hierarchical Granularity-Aware Tree
- Title(参考訳): VADTree:階層的粒度認識木による説明可能なトレーニング不要ビデオ異常検出
- Authors: Wenlong Li, Yifei Xu, Yuan Rao, Zhenhua Wang, Shuiguang Deng,
- Abstract要約: ビデオ異常検出(VAD)は、ビデオ内の異常を特定することに焦点を当てている。
本稿では,階層的粒度木構造を利用したVADTreeを提案する。
VADTreeは、サンプルビデオセグメントの数を劇的に減らしながら、トレーニング不要な環境で最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 21.721087343852158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video anomaly detection (VAD) focuses on identifying anomalies in videos. Supervised methods demand substantial in-domain training data and fail to deliver clear explanations for anomalies. In contrast, training-free methods leverage the knowledge reserves and language interactivity of large pre-trained models to detect anomalies. However, the current fixed-length temporal window sampling approaches struggle to accurately capture anomalies with varying temporal spans. Therefore, we propose VADTree that utilizes a Hierarchical Granularityaware Tree (HGTree) structure for flexible sampling in VAD. VADTree leverages the knowledge embedded in a pre-trained Generic Event Boundary Detection (GEBD) model to characterize potential anomaly event boundaries. Specifically, VADTree decomposes the video into generic event nodes based on boundary confidence, and performs adaptive coarse-fine hierarchical structuring and redundancy removal to construct the HGTree. Then, the multi-dimensional priors are injected into the visual language models (VLMs) to enhance the node-wise anomaly perception, and anomaly reasoning for generic event nodes is achieved via large language models (LLMs). Finally, an inter-cluster node correlation method is used to integrate the multi-granularity anomaly scores. Extensive experiments on three challenging datasets demonstrate that VADTree achieves state-of-the-art performance in training-free settings while drastically reducing the number of sampled video segments. The code will be available at https://github.com/wenlongli10/VADTree.
- Abstract(参考訳): ビデオ異常検出(VAD)は、ビデオ内の異常を特定することに焦点を当てている。
監視された手法はドメイン内のトレーニングデータを必要とするが、異常の明確な説明は得られない。
対照的に、トレーニングフリーな手法は、大きな事前訓練されたモデルの知識予約と言語相互作用を利用して異常を検出する。
しかし、現在の固定長時間窓サンプリング手法は、時間幅の異なる異常を正確に捉えるのに苦労している。
そこで我々は,階層的粒度認識木(HGTree)構造を用いたVADTreeを提案する。
VADTreeは、トレーニング済みのジェネリックイベント境界検出(GEBD)モデルに埋め込まれた知識を利用して、潜在的な異常イベント境界を特徴づける。
具体的には、VADTreeは、ビデオを境界信頼度に基づいて一般的なイベントノードに分解し、適応的な粗い階層構造と冗長性除去を行い、HGTreeを構築する。
次に、多次元前処理を視覚言語モデル(VLM)に注入し、ノード単位の異常知覚を高め、汎用イベントノードの異常推論を大規模言語モデル(LLM)を介して達成する。
最後に、クラスタ間ノード相関法を用いて、多粒度異常スコアを統合する。
3つの挑戦的なデータセットに対する大規模な実験は、VADTreeがトレーニング不要な環境での最先端のパフォーマンスを実現し、サンプルビデオセグメントの数を劇的に削減していることを示している。
コードはhttps://github.com/wenlongli10/VADTree.comから入手できる。
関連論文リスト
- Controllable Graph Generation with Diffusion Models via Inference-Time Tree Search Guidance [36.29334590991777]
グラフ生成は、Webスケールシステム、知識グラフ、薬物や物質発見などの科学領域にまたがる幅広い応用によるグラフ学習の基本的な問題である。
最近のアプローチでは、ステップバイステップの生成に拡散モデルを活用するが、非条件拡散は望ましい性質をほとんど制御せず、しばしば不安定な品質と新しい目的を取り入れることの難しさをもたらす。
推論時間誘導法は、再トレーニングせずにサンプリングプロセスを調整することでこれらの問題を緩和するが、それらは本質的に局所的であり、制御性に制限される。
本稿では,モンテカルロ木探索 (MCTS) で誘導される,制御可能なグラフ生成のための二空間拡散フレームワークであるTreeDiffを提案する。
論文 参考訳(メタデータ) (2025-10-12T01:40:33Z) - Hierarchical Quantized Diffusion Based Tree Generation Method for Hierarchical Representation and Lineage Analysis [49.00783841494125]
HDTreeは階層的潜在空間内の木関係を、統一的な階層的コードブックと量子化拡散プロセスを用いてキャプチャする。
HDTreeの有効性は、汎用データセットと単一セルデータセットの比較によって示される。
これらの貢献は階層的な系統解析のための新しいツールを提供し、より正確で効率的な細胞分化経路のモデリングを可能にする。
論文 参考訳(メタデータ) (2025-06-29T15:19:13Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - CGGM: A conditional graph generation model with adaptive sparsity for node anomaly detection in IoT networks [40.85847606876151]
本稿では,マイノリティクラスに属するサンプルを生成するために,CGGMと呼ばれる新しいグラフ生成モデルを提案する。
フレームワークは、条件付きグラフ生成モジュールとグラフベースの異常検出モジュールの2つのコアモジュールから構成される。
実験により、CGGMは精度とばらつきの点で最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-27T09:55:34Z) - Dynamic Erasing Network Based on Multi-Scale Temporal Features for
Weakly Supervised Video Anomaly Detection [103.92970668001277]
弱教師付きビデオ異常検出のための動的消去ネットワーク(DE-Net)を提案する。
まず,異なる長さのセグメントから特徴を抽出できるマルチスケール時間モデリングモジュールを提案する。
そして,検出された異常の完全性を動的に評価する動的消去戦略を設計する。
論文 参考訳(メタデータ) (2023-12-04T09:40:11Z) - BOURNE: Bootstrapped Self-supervised Learning Framework for Unified
Graph Anomaly Detection [50.26074811655596]
自己指導型自己学習(BOURNE)に基づく新しい統合グラフ異常検出フレームワークを提案する。
ノードとエッジ間のコンテキスト埋め込みを交換することで、ノードとエッジの異常を相互に検出できる。
BOURNEは、負のサンプリングを必要としないため、大きなグラフを扱う際の効率を高めることができる。
論文 参考訳(メタデータ) (2023-07-28T00:44:57Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - DASVDD: Deep Autoencoding Support Vector Data Descriptor for Anomaly
Detection [9.19194451963411]
半教師付き異常検出は、通常のデータに基づいて訓練されたモデルを用いて、通常のサンプルから異常を検出することを目的としている。
本稿では,自己エンコーダのパラメータを協調的に学習する手法であるDASVDDを提案する。
論文 参考訳(メタデータ) (2021-06-09T21:57:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。