論文の概要: Deep Convolutional Neural Networks for Multi-Target Tracking: A Transfer
Learning Approach
- arxiv url: http://arxiv.org/abs/2210.15539v1
- Date: Thu, 27 Oct 2022 15:29:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 15:58:54.030886
- Title: Deep Convolutional Neural Networks for Multi-Target Tracking: A Transfer
Learning Approach
- Title(参考訳): マルチターゲット追跡のための深部畳み込みニューラルネットワーク:伝達学習アプローチ
- Authors: Damian Owerko, Charilaos Kanatsoulis, Alejandro Ribeiro, Donald J.
Bucci Jr, Jennifer Bondarchuk
- Abstract要約: MTT(Multi-target Tracking)は、従来の信号処理タスクである。
畳み込みニューラルネットワーク(CNN)アーキテクチャに対処する。
CNNアーキテクチャは10のターゲットを持つMTTタスクにおいてGM-PHDフィルタより優れている。
- 参考スコア(独自算出の注目度): 94.6341502705845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-target tracking (MTT) is a traditional signal processing task, where
the goal is to estimate the states of an unknown number of moving targets from
noisy sensor measurements. In this paper, we revisit MTT from a deep learning
perspective and propose convolutional neural network (CNN) architectures to
tackle it. We represent the target states and sensor measurements as images.
Thereby we recast the problem as a image-to-image prediction task for which we
train a fully convolutional model. This architecture is motivated by a novel
theoretical bound on the transferability error of CNN. The proposed CNN
architecture outperforms a GM-PHD filter on the MTT task with 10 targets. The
CNN performance transfers without re-training to a larger MTT task with 250
targets with only a $13\%$ increase in average OSPA.
- Abstract(参考訳): マルチターゲットトラッキング(mtt、multi-target tracking)は従来の信号処理タスクである。
本稿では、深層学習の観点からMTTを再検討し、それに取り組むために畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
ターゲット状態とセンサ計測を画像として表現する。
これにより,完全畳み込みモデルを訓練する画像から画像への予測タスクとして問題を再キャストする。
このアーキテクチャは、CNNの転送可能性誤差に関する理論的な境界によって動機付けられている。
提案したCNNアーキテクチャは、MTTタスクにおいて10個のターゲットを持つGM-PHDフィルタより優れている。
cnnのパフォーマンス転送は、平均ospaがわずか13\%$の増加で、250のターゲットを持つより大きなmttタスクに再トレーニングすることなく行われる。
関連論文リスト
- Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.81862342673894]
ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文 参考訳(メタデータ) (2024-03-20T09:17:22Z) - SOMPT22: A Surveillance Oriented Multi-Pedestrian Tracking Dataset [5.962184741057505]
我々はSOMPT22データセットを紹介した。これは、都市監視のための高さ6-8mのポール上の静止カメラから撮影した注釈付きショートビデオを備えた、複数人の追跡のための新しいセットである。
我々は,新しいデータセット上での検出とreIDネットワークの利用方法について,MOTトラッカーをワンショットと2ステージに分類して分析する。
我々の新しいデータセットの実験結果から、SOTAは依然として高効率には程遠いことが示され、シングルショットトラッカーは高速実行と精度を競合性能と一体化するための良い候補である。
論文 参考訳(メタデータ) (2022-08-04T11:09:19Z) - Target Aware Network Architecture Search and Compression for Efficient
Knowledge Transfer [9.434523476406424]
本稿では,効率的な知識伝達を可能にするTASCNetという2段階のフレームワークを提案する。
TASCNetは、トレーニング可能なパラメータとFLOPの両方を削減することにより、目標タスク上の事前学習されたCNNの計算複雑性を低減する。
コンピュータビジョンタスクと同様に、映画レビューセンチメント分析タスクでも実験を行った。
論文 参考訳(メタデータ) (2022-05-12T09:11:00Z) - Auto-Transfer: Learning to Route Transferrable Representations [77.30427535329571]
本稿では,適切なターゲット表現にソース表現をルートする方法を自動学習する,新しい対向型マルチアームバンディット手法を提案する。
最先端の知識伝達手法と比較すると,5%以上の精度向上が期待できる。
論文 参考訳(メタデータ) (2022-02-02T13:09:27Z) - Semantic Segmentation With Multi Scale Spatial Attention For Self
Driving Cars [2.7317088388886384]
本稿では,様々なスケールのマルチスケール特徴融合を用いた新しいニューラルネットワークを提案し,その精度と効率的なセマンティックイメージセグメンテーションを提案する。
我々は、ResNetベースの特徴抽出器、ダウンサンプリング部における拡張畳み込み層、アップサンプリング部におけるアトラス畳み込み層を使用し、コンキャット操作を用いてそれらをマージした。
より文脈的な情報をエンコードし、ネットワークの受容領域を強化するため、新しいアテンションモジュールが提案されている。
論文 参考訳(メタデータ) (2020-06-30T20:19:09Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z) - A Transductive Multi-Head Model for Cross-Domain Few-Shot Learning [72.30054522048553]
本稿では,クロスドメインなFew-Shot学習問題に対処するため,TMHFS(Transductive Multi-Head Few-Shot Learning)を提案する。
提案手法は, 4つの異なる対象領域において, 強いベースライン, 微調整を著しく上回っている。
論文 参考訳(メタデータ) (2020-06-08T02:39:59Z) - COMET: Context-Aware IoU-Guided Network for Small Object Tracking [17.387332692494084]
マルチタスク2ストリームネットワークとオフライン参照提案生成戦略を利用したコンテキスト対応IoU誘導トラッカー(COMET)を提案する。
提案するネットワークは,マルチスケールの特徴学習とアテンションモジュールによるターゲット関連情報を完全に活用する。
経験的に、COMETは、小さなオブジェクトを追跡することに焦点を当てた、さまざまな空中ビューデータセットにおいて、最先端のデータをパフォーマンスします。
論文 参考訳(メタデータ) (2020-06-04T00:28:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。