論文の概要: Multiple Pedestrians and Vehicles Tracking in Aerial Imagery: A
Comprehensive Study
- arxiv url: http://arxiv.org/abs/2010.09689v1
- Date: Mon, 19 Oct 2020 17:26:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 22:15:43.209466
- Title: Multiple Pedestrians and Vehicles Tracking in Aerial Imagery: A
Comprehensive Study
- Title(参考訳): 航空画像における複数の歩行者・車両追跡 : 総合的研究
- Authors: Seyed Majid Azimi, Maximilian Kraus, Reza Bahmanyar, Peter Reinartz
- Abstract要約: 本稿では,ディープラーニングに基づく多目的追跡手法であるAerialMPTNetについて述べる。
また,AerialMPTNetの性能に及ぼすSqueeze-and-Excitation層とOnline Hard Example Miningの影響について検討した。
その結果,空中多目的追跡領域の課題と可能性について,より深い知見が得られた。
- 参考スコア(独自算出の注目度): 6.327655795051618
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we address various challenges in multi-pedestrian and vehicle
tracking in high-resolution aerial imagery by intensive evaluation of a number
of traditional and Deep Learning based Single- and Multi-Object Tracking
methods. We also describe our proposed Deep Learning based Multi-Object
Tracking method AerialMPTNet that fuses appearance, temporal, and graphical
information using a Siamese Neural Network, a Long Short-Term Memory, and a
Graph Convolutional Neural Network module for a more accurate and stable
tracking. Moreover, we investigate the influence of the Squeeze-and-Excitation
layers and Online Hard Example Mining on the performance of AerialMPTNet. To
the best of our knowledge, we are the first in using these two for a
regression-based Multi-Object Tracking. Additionally, we studied and compared
the L1 and Huber loss functions. In our experiments, we extensively evaluate
AerialMPTNet on three aerial Multi-Object Tracking datasets, namely AerialMPT
and KIT AIS pedestrian and vehicle datasets. Qualitative and quantitative
results show that AerialMPTNet outperforms all previous methods for the
pedestrian datasets and achieves competitive results for the vehicle dataset.
In addition, Long Short-Term Memory and Graph Convolutional Neural Network
modules enhance the tracking performance. Moreover, using
Squeeze-and-Excitation and Online Hard Example Mining significantly helps for
some cases while degrades the results for other cases. In addition, according
to the results, L1 yields better results with respect to Huber loss for most of
the scenarios. The presented results provide a deep insight into challenges and
opportunities of the aerial Multi-Object Tracking domain, paving the way for
future research.
- Abstract(参考訳): 本稿では,高精細度空中画像における複数歩行者・車両追跡の課題を,従来型および深層学習に基づく複数物体追跡手法の集中的評価により解決する。
また,Samese Neural Network,Long Short-Term Memory,Graph Convolutional Neural Networkモジュールを用いて外観,時間,図形情報を融合し,より正確かつ安定した追跡を行う,ディープラーニングに基づく多対象追跡手法であるAerialMPTNetについて述べる。
さらに,Squeeze-and-Excitation 層と Online Hard Example Mining が AerialMPTNet の性能に与える影響について検討した。
私たちの知る限りでは、回帰ベースのマルチオブジェクト追跡にこれら2つを使うのは初めてです。
さらに,L1 と Huber の損失関数について検討,比較した。
実験では,AerialMPTとKIT AIS歩行者と車両の3つの空中多目的追跡データセットに対して,AerialMPTNetを広範囲に評価した。
定性的かつ定量的な結果から、AerialMPTNetは歩行者データセットのすべての従来の手法より優れており、車両データセットの競合的な結果が得られる。
さらに、Long Short-Term MemoryとGraph Convolutional Neural Networkモジュールは、トラッキングパフォーマンスを向上させる。
さらに、Squeeze-and-Excitation と Online Hard Example Mining は、いくつかのケースで有効であり、他のケースでは結果を劣化させる。
さらに、結果によると、l1は、ほとんどのシナリオにおいて、フーバー損失に関してより良い結果をもたらす。
これらの結果は,航空多目的追跡分野の課題と機会を深く理解し,今後の研究への道を開くものである。
関連論文リスト
- Exploring Dynamic Transformer for Efficient Object Tracking [58.120191254379854]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2024-03-26T12:31:58Z) - Single-Shot and Multi-Shot Feature Learning for Multi-Object Tracking [55.13878429987136]
そこで本研究では,異なる目標に対して,単発と複数発の特徴を共同で学習するための,シンプルで効果的な2段階特徴学習パラダイムを提案する。
提案手法は,DanceTrackデータセットの最先端性能を達成しつつ,MOT17およびMOT20データセットの大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-11-17T08:17:49Z) - A Bayesian Detect to Track System for Robust Visual Object Tracking and
Semi-Supervised Model Learning [1.7268829007643391]
ニューラルネットワークの出力によってパラメータ化されたベイズ追跡・検出フレームワークにおける副次的問題について述べる。
本稿では,粒子フィルタを用いた物体状態推定のための近似サンプリングアルゴリズムを提案する。
粒子フィルタ推論アルゴリズムを用いて,間欠的なラベル付きフレーム上でのトラッキングネットワークの学習に半教師付き学習アルゴリズムを用いる。
論文 参考訳(メタデータ) (2022-05-05T00:18:57Z) - Aerial Images Meet Crowdsourced Trajectories: A New Approach to Robust
Road Extraction [110.61383502442598]
我々は、Cross-Modal Message Propagation Network (CMMPNet)と呼ばれる新しいニューラルネットワークフレームワークを紹介する。
CMMPNetは、モダリティ固有の表現学習のための2つのディープオートエンコーダと、クロスモーダル表現洗練のためのテーラー設計のデュアルエンハンスメントモジュールで構成されている。
実世界の3つのベンチマーク実験により, CMMPNetによる堅牢な道路抽出の有効性が示された。
論文 参考訳(メタデータ) (2021-11-30T04:30:10Z) - Scene Understanding for Autonomous Driving [0.0]
Detectron2で提示されたRetinaNet, Faster R-CNN, Mask R-CNNの異なる構成の挙動を検討する。
関心のあるデータセット上でこれらのモデルを微調整した後、パフォーマンスの大幅な改善を観察します。
文脈外のデータセットを用いて異常な状況下で推論を行い、興味深い結果を示す。
論文 参考訳(メタデータ) (2021-05-11T09:50:05Z) - Probabilistic 3D Multi-Modal, Multi-Object Tracking for Autonomous
Driving [22.693895321632507]
異なる訓練可能なモジュールからなる確率的、マルチモーダル、マルチオブジェクトトラッキングシステムを提案する。
本手法はNuScenes Trackingデータセットの現在の状態を上回っていることを示した。
論文 参考訳(メタデータ) (2020-12-26T15:00:54Z) - AerialMPTNet: Multi-Pedestrian Tracking in Aerial Imagery Using Temporal
and Graphical Features [7.4174957519107485]
AerialMPTNetはジオレファレンスな航空画像における複数歩行者追跡のための新しい手法である。
Aerial Multi-Pedestrian Tracking (AerialMPT) データセットについて述べる。
AerialMPTNetは精度と時間効率で他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-27T22:02:29Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z) - Robust Visual Object Tracking with Two-Stream Residual Convolutional
Networks [62.836429958476735]
視覚追跡のための2ストリーム残差畳み込みネットワーク(TS-RCN)を提案する。
私たちのTS-RCNは、既存のディープラーニングベースのビジュアルトラッカーと統合することができます。
トラッキング性能をさらに向上するため、我々はResNeXtを特徴抽出バックボーンとして採用する。
論文 参考訳(メタデータ) (2020-05-13T19:05:42Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。