論文の概要: Self-Supervised Multi-Object Tracking with Cross-Input Consistency
- arxiv url: http://arxiv.org/abs/2111.05943v1
- Date: Wed, 10 Nov 2021 21:00:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-13 04:27:48.162300
- Title: Self-Supervised Multi-Object Tracking with Cross-Input Consistency
- Title(参考訳): クロス入力一貫性を持つ自己教師付きマルチオブジェクトトラッキング
- Authors: Favyen Bastani, Songtao He, Sam Madden
- Abstract要約: 本稿では,ラベルなしビデオのみを対象とする頑健なマルチオブジェクト追跡(MOT)モデルを訓練するための自己教師付き学習手法を提案する。
次に、各入力に対して独立してRNNモデルを適用することで、そのシーケンス内のトラックを計算し、2つの入力に対して一貫したトラックを生成するようにモデルを訓練する。
- 参考スコア(独自算出の注目度): 5.8762433393846045
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a self-supervised learning procedure for training a
robust multi-object tracking (MOT) model given only unlabeled video. While
several self-supervisory learning signals have been proposed in prior work on
single-object tracking, such as color propagation and cycle-consistency, these
signals cannot be directly applied for training RNN models, which are needed to
achieve accurate MOT: they yield degenerate models that, for instance, always
match new detections to tracks with the closest initial detections. We propose
a novel self-supervisory signal that we call cross-input consistency: we
construct two distinct inputs for the same sequence of video, by hiding
different information about the sequence in each input. We then compute tracks
in that sequence by applying an RNN model independently on each input, and
train the model to produce consistent tracks across the two inputs. We evaluate
our unsupervised method on MOT17 and KITTI -- remarkably, we find that, despite
training only on unlabeled video, our unsupervised approach outperforms four
supervised methods published in the last 1--2 years, including Tracktor++,
FAMNet, GSM, and mmMOT.
- Abstract(参考訳): 本稿では,ラベルなしビデオのみを与えられたロバストマルチオブジェクトトラッキング(mot)モデルを学習するための自己教師あり学習手順を提案する。
色伝搬やサイクル整合性などの単一対象追跡に関する先行研究において、いくつかの自己超越学習信号が提案されているが、これらの信号は正確なMOTを達成するために必要なRNNモデルのトレーニングには直接適用できない。
そこで本研究では,同一映像列に対する2つの異なる入力を,各入力列の異なる情報を隠すことにより構築する,クロス入力一貫性と呼ばれる新しい自己スーパーバイザリー信号を提案する。
次に、各入力に対して独立してRNNモデルを適用することで、そのシーケンス内のトラックを計算し、2つの入力に対して一貫したトラックを生成するようにモデルを訓練する。
私たちはMOT17とKITTIで教師なしの手法を評価した -- 驚くべきことに、未ラベルのビデオのみをトレーニングしても、Tracktor++、FAMNet、GSM、mmMOTを含む過去1~2年で公表された4つの教師なしの手法よりも優れています。
関連論文リスト
- Walker: Self-supervised Multiple Object Tracking by Walking on Temporal Appearance Graphs [117.67620297750685]
これは、疎結合なボックスアノテーションとトラッキングラベルのないビデオから学習する、初めてのセルフ教師付きトラッカーである。
Walker氏はMOT17、DanceTrack、BDD100Kで競争力を発揮する最初のセルフトラッカーである。
論文 参考訳(メタデータ) (2024-09-25T18:00:00Z) - ConsistencyTrack: A Robust Multi-Object Tracker with a Generation Strategy of Consistency Model [20.259334882471574]
マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおいて重要な技術であり、ビデオシーケンス内の複数のターゲットを検出し、各ターゲットにフレーム毎にユニークなIDを割り当てるように設計されている。
既存のMOTメソッドは、様々なシナリオでリアルタイムで複数のオブジェクトを正確に追跡する。
本稿では,境界ボックス上の拡散過程として検出と関連を定式化するための新しいConsistencyTrack, Joint Detection and Tracking (JDT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-28T05:53:30Z) - Refining Pre-Trained Motion Models [56.18044168821188]
我々は、自己教師付きトレーニングによる最先端の教師付きモデルの改善に挑戦する。
実世界の未学習ビデオから「クリーン」な訓練信号を得ることに重点を置いている。
本研究では,本手法が実動画における完全教師付き手法よりも信頼性が高いことを示す。
論文 参考訳(メタデータ) (2024-01-01T18:59:33Z) - IDM-Follower: A Model-Informed Deep Learning Method for Long-Sequence
Car-Following Trajectory Prediction [24.94160059351764]
ほとんどの自動車追従モデルは生成的であり、最後のステップの速度、位置、加速度の入力のみを考慮する。
2つの独立したエンコーダと、次の軌道を逐次予測できる自己アテンションデコーダを備えた新しい構造を実装した。
シミュレーションとNGSIMデータセットの複数の設定による数値実験により、IMM-Followerは予測性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2022-10-20T02:24:27Z) - MM-TTA: Multi-Modal Test-Time Adaptation for 3D Semantic Segmentation [104.48766162008815]
本稿では,3次元セマンティックセグメンテーションのためのテスト時間適応のマルチモーダル拡張を提案する。
マルチモダリティを最大限に活用できるフレームワークを設計するために、各モダリティは他のモダリティに対して正規化された自己監督信号を提供する。
正規化された擬似ラベルは、多数の多モードテスト時間適応シナリオにおいて安定した自己学習信号を生成する。
論文 参考訳(メタデータ) (2022-04-27T02:28:12Z) - Unified Transformer Tracker for Object Tracking [58.65901124158068]
異なるシナリオにおけるトラッキング問題に1つのパラダイムで対処するために,UTT(Unified Transformer Tracker)を提案する。
SOT(Single Object Tracking)とMOT(Multiple Object Tracking)の両方を対象とするトラックトランスフォーマーを開発した。
論文 参考訳(メタデータ) (2022-03-29T01:38:49Z) - Exploring Simple 3D Multi-Object Tracking for Autonomous Driving [10.921208239968827]
LiDARポイントクラウドにおける3Dマルチオブジェクトトラッキングは、自動運転車にとって重要な要素である。
既存の手法は、主にトラッキング・バイ・検出パイプラインに基づいており、検出アソシエーションのマッチングステップが必然的に必要である。
我々は,手作りの追跡パラダイムをシンプルにするために,原点雲からの共同検出と追跡のためのエンドツーエンドのトレーニング可能なモデルを提案する。
論文 参考訳(メタデータ) (2021-08-23T17:59:22Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z) - A Novel Anomaly Detection Algorithm for Hybrid Production Systems based
on Deep Learning and Timed Automata [73.38551379469533]
DAD:DeepAnomalyDetectionは,ハイブリッド生産システムにおける自動モデル学習と異常検出のための新しいアプローチである。
深層学習とタイムドオートマトンを組み合わせて、観察から行動モデルを作成する。
このアルゴリズムは実システムからの2つのデータを含む少数のデータセットに適用され、有望な結果を示している。
論文 参考訳(メタデータ) (2020-10-29T08:27:43Z) - Multi-object tracking with self-supervised associating network [5.947279761429668]
人間のラベリングを伴わない短い動画を多数使用して,新たな自己教師型学習手法を提案する。
再識別ネットワークは自己管理方式で訓練されているが、MOTA 62.0% と IDF1 62.6% の最先端性能をMOT17テストベンチマークで達成している。
論文 参考訳(メタデータ) (2020-10-26T08:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。