論文の概要: Towards Discriminative Representation: Multi-view Trajectory Contrastive
Learning for Online Multi-object Tracking
- arxiv url: http://arxiv.org/abs/2203.14208v1
- Date: Sun, 27 Mar 2022 04:53:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 15:00:13.828337
- Title: Towards Discriminative Representation: Multi-view Trajectory Contrastive
Learning for Online Multi-object Tracking
- Title(参考訳): 識別表現に向けて:オンライン多目的追跡のための多視点軌跡コントラスト学習
- Authors: En Yu, Zhuoling Li, Shoudong Han
- Abstract要約: 本稿では,多視点トラジェクティブ・コントラスト学習という戦略を提案し,各トラジェクトリを中心ベクトルとして表現する。
推論段階では、軌道表現の質をさらに高めるために類似性誘導型特徴融合戦略を開発する。
我々の手法は先行トラッカーを超え、新しい最先端のパフォーマンスを確立した。
- 参考スコア(独自算出の注目度): 1.0474108328884806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discriminative representation is crucial for the association step in
multi-object tracking. Recent work mainly utilizes features in single or
neighboring frames for constructing metric loss and empowering networks to
extract representation of targets. Although this strategy is effective, it
fails to fully exploit the information contained in a whole trajectory. To this
end, we propose a strategy, namely multi-view trajectory contrastive learning,
in which each trajectory is represented as a center vector. By maintaining all
the vectors in a dynamically updated memory bank, a trajectory-level
contrastive loss is devised to explore the inter-frame information in the whole
trajectories. Besides, in this strategy, each target is represented as multiple
adaptively selected keypoints rather than a pre-defined anchor or center. This
design allows the network to generate richer representation from multiple views
of the same target, which can better characterize occluded objects.
Additionally, in the inference stage, a similarity-guided feature fusion
strategy is developed for further boosting the quality of the trajectory
representation. Extensive experiments have been conducted on MOTChallenge to
verify the effectiveness of the proposed techniques. The experimental results
indicate that our method has surpassed preceding trackers and established new
state-of-the-art performance.
- Abstract(参考訳): 識別表現は多目的追跡における関連ステップにおいて重要である。
最近の研究は、主に1フレームまたは隣接フレームの特徴を利用してメートル法損失を構築し、ネットワークに目標の表現を付与している。
この戦略は効果的であるが、全軌道に含まれる情報を十分に活用できない。
そこで本研究では,各軌跡を中心ベクトルとして表現する多視点軌跡コントラスト学習手法を提案する。
全てのベクトルを動的に更新されたメモリバンクに保持することにより、トラジェクトリレベルのコントラスト損失を考案し、トラジェクトリ全体のフレーム間情報を探索する。
さらに、この戦略では、各ターゲットは事前定義されたアンカーや中心ではなく、複数の適応的に選択されたキーポイントとして表現される。
この設計により、ネットワークは同じターゲットの複数のビューからよりリッチな表現を生成することができる。
さらに, 推定段階では, 軌道表現の品質をさらに高めるため, 類似性誘導型特徴融合戦略が開発されている。
提案手法の有効性を検証するため,MOTChallengeで大規模な実験を行った。
実験の結果,提案手法は先行トラッカーを超え,新しい最先端性能を確立した。
関連論文リスト
- Context-Enhanced Multi-View Trajectory Representation Learning: Bridging the Gap through Self-Supervised Models [27.316692263196277]
MVTrajは、軌道表現学習のための新しい多視点モデリング手法である。
GPSから道路網、関心点まで多様な文脈知識を統合し、軌跡データのより包括的な理解を提供する。
実世界のデータセットに対する大規模な実験により、MVTrajは様々な空間ビューに関連するタスクにおいて、既存のベースラインを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-10-17T03:56:12Z) - Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Single-Shot and Multi-Shot Feature Learning for Multi-Object Tracking [55.13878429987136]
そこで本研究では,異なる目標に対して,単発と複数発の特徴を共同で学習するための,シンプルで効果的な2段階特徴学習パラダイムを提案する。
提案手法は,DanceTrackデータセットの最先端性能を達成しつつ,MOT17およびMOT20データセットの大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-11-17T08:17:49Z) - Masked Momentum Contrastive Learning for Zero-shot Semantic
Understanding [39.424931953675994]
自己教師付き事前学習(SSP)は、ラベル付きデータなしで有意義な特徴表現を抽出できる機械学習の一般的な手法として登場した。
本研究は、コンピュータビジョンタスクにおける純粋な自己教師付き学習(SSL)技術の有効性を評価する。
論文 参考訳(メタデータ) (2023-08-22T13:55:57Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Dynamic Attention guided Multi-Trajectory Analysis for Single Object
Tracking [62.13213518417047]
動的注意誘導型マルチ軌道追跡戦略を考案し,さらにダイナミクスを導入することを提案する。
特に、複数のターゲットテンプレートを含む動的外観モデルを構築し、それぞれが新しいフレーム内のターゲットを特定するのに独自の注意を払っています。
シーケンス全体にまたがった後、マルチ軌道選択ネットワークを導入し、トラッキング性能を向上させた最適な軌道を見つけます。
論文 参考訳(メタデータ) (2021-03-30T05:36:31Z) - Multi-object Tracking with a Hierarchical Single-branch Network [31.680667324595557]
階層的な単一ブランチネットワークに基づくオンライン多目的追跡フレームワークを提案する。
新たなiHOIM損失関数は,2つのサブタスクの目的を統一し,より優れた検出性能を実現する。
MOT16とMOT20データセットの実験結果から,最先端のトラッキング性能が達成できた。
論文 参考訳(メタデータ) (2021-01-06T12:14:58Z) - Centralized Information Interaction for Salient Object Detection [68.8587064889475]
U字型構造は、多スケールの機能を効率的に組み合わせるサリエント物体検出に長けている。
本稿では,これらの接続を集中化することにより,相互に相互に情報交換を行うことができることを示す。
本手法は, ボトムアップ経路とトップダウン経路の接続を置換することにより, 既存のU字型サルエント物体検出手法と協調することができる。
論文 参考訳(メタデータ) (2020-12-21T12:42:06Z) - Visual Object Tracking by Segmentation with Graph Convolutional Network [7.729569666460712]
グラフ畳み込みネットワーク(GCN)モデルを用いて,スーパーピクセルベースのオブジェクトトラッキングを提案する。
提案モデルは,i)ラベル線形予測とi)各スーパーピクセルの構造認識特徴情報を統合した,汎用的なエンドツーエンドフレームワークを提供する。
論文 参考訳(メタデータ) (2020-09-05T12:43:21Z) - Dynamic Feature Integration for Simultaneous Detection of Salient
Object, Edge and Skeleton [108.01007935498104]
本稿では,高次物体分割,エッジ検出,スケルトン抽出など,低レベルの3つの視覚問題を解く。
まず、これらのタスクで共有される類似点を示し、統一されたフレームワークの開発にどのように活用できるかを示す。
論文 参考訳(メタデータ) (2020-04-18T11:10:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。