論文の概要: Multi-Object Tracking and Segmentation with a Space-Time Memory Network
- arxiv url: http://arxiv.org/abs/2110.11284v2
- Date: Tue, 16 May 2023 01:16:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 21:24:41.645376
- Title: Multi-Object Tracking and Segmentation with a Space-Time Memory Network
- Title(参考訳): 時空間メモリネットワークを用いたマルチオブジェクト追跡とセグメンテーション
- Authors: Mehdi Miah, Guillaume-Alexandre Bilodeau and Nicolas Saunier
- Abstract要約: トラックレットを関連づける新しいメモリベース機構に基づく多目的追跡とセグメンテーションの手法を提案する。
提案するトラッカーであるMeNToSは、特に長期データアソシエーションの問題に対処する。
- 参考スコア(独自算出の注目度): 12.043574473965318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a method for multi-object tracking and segmentation based on a
novel memory-based mechanism to associate tracklets. The proposed tracker,
MeNToS, addresses particularly the long-term data association problem, when
objects are not observable for long time intervals. Indeed, the recently
introduced HOTA metric (High Order Tracking Accuracy), which has a better
alignment than the formerly established MOTA (Multiple Object Tracking
Accuracy) with the human visual assessment of tracking, has shown that
improvements are still needed for data association, despite the recent
improvement in object detection. In MeNToS, after creating tracklets using
instance segmentation and optical flow, the proposed method relies on a
space-time memory network originally developed for one-shot video object
segmentation to improve the association of sequence of detections (tracklets)
with temporal gaps. We evaluate our tracker on KITTIMOTS and MOTSChallenge and
we show the benefit of our data association strategy with the HOTA metric.
Additional ablation studies demonstrate that our approach using a space-time
memory network gives better and more robust long-term association than those
based on a re-identification network. Our project page is at
\url{www.mehdimiah.com/mentos+}.
- Abstract(参考訳): トラックレットを関連づける新しいメモリベース機構に基づく多目的追跡とセグメンテーションの手法を提案する。
提案するトラッカーであるMeNToSは、オブジェクトが長期にわたって観測できない場合、特に長期データアソシエーションの問題に対処する。
実際、最近導入されたHOTAメトリック(High Order Tracking Accuracy)は、従来のMOTA(Multiple Object Tracking Accuracy)と人間の視覚的追跡評価との整合性が高いが、最近のオブジェクト検出の改善にもかかわらず、データアソシエーションには改善が必要であることが示されている。
MeNToSでは、インスタンスセグメンテーションと光フローを用いてトラックレットを作成した後、この手法は1ショットビデオオブジェクトセグメンテーションのために開発された時空間メモリネットワークを利用して、検出シーケンス(トラックレット)と時間的ギャップの関連性を改善する。
我々は、KITTIMOTSとMOTSChallengeのトラッカーを評価し、HOTAメトリックによるデータアソシエーション戦略の利点を示す。
追加のアブレーション研究により、時空メモリネットワークを用いたアプローチは、再同定ネットワークに基づくものよりも、より良く、より堅牢な長期関連をもたらすことが示された。
プロジェクトページは \url{www.mehdimiah.com/mentos+} にある。
関連論文リスト
- STCMOT: Spatio-Temporal Cohesion Learning for UAV-Based Multiple Object Tracking [13.269416985959404]
無人航空機(UAV)ビデオにおける複数物体追跡(MOT)は、コンピュータビジョンにおける多様な用途において重要である。
時空間結合型多目的追跡フレームワーク(STCMOT)を提案する。
歴史的埋め込み機能を用いて,ReIDの表現と検出機能を逐次的にモデル化する。
我々のフレームワークはMOTAとIDF1メトリクスで新しい最先端のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2024-09-17T14:34:18Z) - Tracking Objects and Activities with Attention for Temporal Sentence
Grounding [51.416914256782505]
時間文 (TSG) は、意味的に自然言語のクエリと一致した時間セグメントを、トリミングされていないセグメントでローカライズすることを目的としている。
本稿では,(A)マルチモーダル・検索空間を生成するクロスモーダル・ターゲット・ジェネレータと(B)マルチモーダル・ターゲットの動作を追跡し,クエリ関連セグメントを予測するテンポラル・センセント・トラッカーとを含む,新しいテンポラル・センセント・トラッカー・ネットワーク(TSTNet)を提案する。
論文 参考訳(メタデータ) (2023-02-21T16:42:52Z) - STURE: Spatial-Temporal Mutual Representation Learning for Robust Data
Association in Online Multi-Object Tracking [7.562844934117318]
提案手法は、より区別された検出とシーケンス表現を抽出することができる。
パブリックMOTチャレンジベンチマークに適用され、様々な最先端のオンラインMOTトラッカーとよく比較される。
論文 参考訳(メタデータ) (2022-01-18T08:52:40Z) - Adaptive Affinity for Associations in Multi-Target Multi-Camera Tracking [53.668757725179056]
本稿では,MTMCTにおけるアフィニティ推定を対応する対応範囲に適応させるための,単純かつ効果的な手法を提案する。
すべての外見の変化に対処する代わりに、データアソシエーション中に出現する可能性のあるものに特化したアフィニティメトリックを調整します。
ミスマッチを最小限に抑えるため、アダプティブアフィニティモジュールはグローバルなre-ID距離を大幅に改善する。
論文 参考訳(メタデータ) (2021-12-14T18:59:11Z) - Learning Dynamic Compact Memory Embedding for Deformable Visual Object
Tracking [82.34356879078955]
本稿では,セグメント化に基づく変形可能な視覚追跡手法の識別を強化するために,コンパクトなメモリ埋め込みを提案する。
DAVIS 2017ベンチマークでは,D3SやSiamMaskなどのセグメンテーションベースのトラッカーよりも優れている。
論文 参考訳(メタデータ) (2021-11-23T03:07:12Z) - MeNToS: Tracklets Association with a Space-Time Memory Network [12.416351779111864]
提案手法は特にデータ関連問題に対処する。
MeNToSは、MOTSのオブジェクトマスクを追跡するためにSTMネットワークを使用した最初の企業である。
我々はRobMOTSチャレンジで4位になった。
論文 参考訳(メタデータ) (2021-07-15T01:33:21Z) - Learning to Track with Object Permanence [61.36492084090744]
共同物体の検出と追跡のためのエンドツーエンドのトレーニング可能なアプローチを紹介します。
私たちのモデルは、合成データと実データで共同トレーニングされ、KITTIおよびMOT17データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2021-03-26T04:43:04Z) - TDIOT: Target-driven Inference for Deep Video Object Tracking [0.2457872341625575]
本研究では,事前訓練したMask R-CNNディープオブジェクト検出器をベースラインとして採用する。
本研究では,Mask R-CNNのFPN-ResNet101バックボーン上に新しい推論アーキテクチャを導入し,検出と追跡を共同で行う。
提案する単一オブジェクトトラッカであるtdiotは、データアソシエーションに外観類似性に基づく時間マッチングを適用する。
論文 参考訳(メタデータ) (2021-03-19T20:45:06Z) - Learning Spatio-Appearance Memory Network for High-Performance Visual
Tracking [79.80401607146987]
既存のオブジェクトトラッキングは通常、フレーム間の視覚的ターゲットにマッチするバウンディングボックスベースのテンプレートを学習する。
本稿では,局所時間メモリネットワークを備え,正確な時空間対応を学習するセグメンテーションに基づくトラッキングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-21T08:12:02Z) - Fast Video Object Segmentation With Temporal Aggregation Network and
Dynamic Template Matching [67.02962970820505]
ビデオオブジェクト(VOS)に「トラッキング・バイ・検出」を導入する。
本稿では,時間的アグリゲーションネットワークと動的時間進化テンプレートマッチング機構を提案する。
我々は,DAVISベンチマークで1フレームあたり0.14秒,J&Fで75.9%の速度で,複雑なベルとホイッスルを伴わずに,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-11T05:44:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。