論文の概要: Enhanced Few-shot Learning for Intrusion Detection in Railway Video
Surveillance
- arxiv url: http://arxiv.org/abs/2011.04254v1
- Date: Mon, 9 Nov 2020 08:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 02:38:09.376337
- Title: Enhanced Few-shot Learning for Intrusion Detection in Railway Video
Surveillance
- Title(参考訳): 鉄道ビデオサーベイランスにおける侵入検知のためのFew-shot学習の強化
- Authors: Xiao Gong, Xi Chen, Wei Chen
- Abstract要約: 拡張モデル非依存メタラーナーは、オリジナルビデオフレームと、ビデオから抽出されたトラック領域のセグメンテッドマスクの両方を用いて訓練される。
解析結果から,拡張メタラーナーは,新たに収集したビデオフレームのサンプルをわずかに残さず,見知らぬシーンに適応できることが示唆された。
- 参考スコア(独自算出の注目度): 16.220077781635748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video surveillance is gaining increasing popularity to assist in railway
intrusion detection in recent years. However, efficient and accurate intrusion
detection remains a challenging issue due to: (a) limited sample number: only
small sample size (or portion) of intrusive video frames is available; (b) low
inter-scene dissimilarity: various railway track area scenes are captured by
cameras installed in different landforms; (c) high intra-scene similarity: the
video frames captured by an individual camera share a same backgound. In this
paper, an efficient few-shot learning solution is developed to address the
above issues. In particular, an enhanced model-agnostic meta-learner is trained
using both the original video frames and segmented masks of track area
extracted from the video. Moreover, theoretical analysis and engineering
solutions are provided to cope with the highly similar video frames in the
meta-model training phase. The proposed method is tested on realistic railway
video dataset. Numerical results show that the enhanced meta-learner
successfully adapts unseen scene with only few newly collected video frame
samples, and its intrusion detection accuracy outperforms that of the standard
randomly initialized supervised learning.
- Abstract(参考訳): 近年、鉄道侵入検知を支援するためにビデオ監視が人気を集めている。
しかし, 効率的かつ高精度な侵入検出は, 課題である。
(a)限定サンプル数:侵入型ビデオフレームの小さなサンプルサイズ(または一部)のみ利用可能。
(b)低いシーン間相違:様々な鉄道線路エリアのシーンを異なる地形に設置したカメラで撮影する。
(c)シーン内類似度が高い:個々のカメラが捉えたビデオフレームは同じバックガンドを共有している。
本稿では,上記の問題に対処するために,効率的な数発学習ソリューションを開発した。
特に、拡張されたモデル非依存メタリーナーは、ビデオから抽出されたトラックエリアのオリジナルビデオフレームとセグメンテッドマスクの両方を使用して訓練される。
さらに,メタモデル訓練段階での類似度の高い映像フレームに対処するために,理論的解析と工学的解を提供する。
提案手法は現実的な鉄道ビデオデータセットで検証される。
数値的な結果から,拡張メタラーナーはビデオフレームのサンプルを少数集めて未確認シーンに適応し,侵入検出精度はランダムに初期化された教師付き学習よりも優れていた。
関連論文リスト
- Practical Video Object Detection via Feature Selection and Aggregation [18.15061460125668]
ビデオオブジェクト検出(VOD)は、オブジェクトの外観における高いフレーム間変動と、いくつかのフレームにおける多様な劣化を懸念する必要がある。
現代のアグリゲーション法のほとんどは、高い計算コストに苦しむ2段階検出器用に調整されている。
この研究は、特徴選択と集約の非常に単純だが強力な戦略を考案し、限界計算コストでかなりの精度を得る。
論文 参考訳(メタデータ) (2024-07-29T02:12:11Z) - AVTENet: Audio-Visual Transformer-based Ensemble Network Exploiting
Multiple Experts for Video Deepfake Detection [53.448283629898214]
近年の超現実的なディープフェイクビデオの普及は、オーディオと視覚の偽造の脅威に注意を向けている。
AI生成のフェイクビデオの検出に関するこれまでのほとんどの研究は、視覚的モダリティまたはオーディオ的モダリティのみを使用していた。
音響操作と視覚操作の両方を考慮したAVTENet(Audio-Visual Transformer-based Ensemble Network)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-19T19:01:26Z) - Learning Trajectory-Aware Transformer for Video Super-Resolution [50.49396123016185]
ビデオ超解像は、高解像度(HR)フレームを低解像度(LR)フレームから復元することを目的としている。
既存のアプローチは通常、隣接する限られたフレームからビデオフレームを並べて集約する。
ビデオ超解像用トランスフォーマー(TTVSR)を提案する。
論文 参考訳(メタデータ) (2022-04-08T03:37:39Z) - Anomaly Crossing: A New Method for Video Anomaly Detection as
Cross-domain Few-shot Learning [32.0713939637202]
ビデオ異常検出は、ビデオで発生した異常事象を特定することを目的としている。
従来のアプローチのほとんどは、教師なしまたは半教師なしの手法で通常のビデオからのみ学習する。
本稿では,ビデオの異常検出に通常のビデオと異常ビデオの両方をフル活用することで,新たな学習パラダイムを提案する。
論文 参考訳(メタデータ) (2021-12-12T20:49:38Z) - PAT: Pseudo-Adversarial Training For Detecting Adversarial Videos [20.949656274807904]
我々は,攻撃の知識を必要とせず,映像中の対角フレームを検出するための,Pseudo-versa-Adrial Training (PAT) という,新しい単純なアルゴリズムを提案する。
UCF-101および20BN-Jesterデータセットによる実験結果から、PATは高い検出率で対向的なビデオフレームやビデオを検出することができることがわかった。
論文 参考訳(メタデータ) (2021-09-13T04:05:46Z) - Few-Shot Learning for Video Object Detection in a Transfer-Learning
Scheme [70.45901040613015]
ビデオ物体検出のための数発学習の新たな課題について検討する。
我々は,多数のベースクラスオブジェクトに対して映像物体検出を効果的に訓練するトランスファー学習フレームワークと,ノベルクラスオブジェクトのいくつかのビデオクリップを用いる。
論文 参考訳(メタデータ) (2021-03-26T20:37:55Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - Uncertainty-Aware Weakly Supervised Action Detection from Untrimmed
Videos [82.02074241700728]
本稿では,ビデオフレームラベルのみを用いてトレーニングした,禁止レベルの行動認識モデルを提案する。
人1人当たりの手法は、複数のインスタンス学習フレームワーク内の大規模な画像データセットで訓練されている。
標準的な多重インスタンス学習の仮定では、各バッグには、指定されたラベルを持つ少なくとも1つのインスタンスが含まれているという仮定が無効である場合、どのようにメソッドを適用するかを示す。
論文 参考訳(メタデータ) (2020-07-21T10:45:05Z) - TubeTK: Adopting Tubes to Track Multi-Object in a One-Step Training
Model [51.14840210957289]
マルチオブジェクトトラッキングは、長い間研究されてきた基本的な視覚問題である。
Tracking by Detection (TBD)の成功にもかかわらず、この2段階の手法はエンドツーエンドでトレーニングするには複雑すぎる。
本稿では,短いビデオクリップ中の物体の時間空間位置を示すために,バウンディングチューブを導入することで,一段階のトレーニングしか必要としない簡潔なエンドツーエンドモデルチューブTKを提案する。
論文 参考訳(メタデータ) (2020-06-10T06:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。