論文の概要: S$^3$Track: Self-supervised Tracking with Soft Assignment Flow
- arxiv url: http://arxiv.org/abs/2305.09981v1
- Date: Wed, 17 May 2023 06:25:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 17:13:34.676850
- Title: S$^3$Track: Self-supervised Tracking with Soft Assignment Flow
- Title(参考訳): s$^3$track:ソフト割り当てフローを用いた自己教師付きトラッキング
- Authors: Fatemeh Azimi and Fahim Mannan and Felix Heide
- Abstract要約: ビデオレベルのアソシエーションラベルを使わずに、自己監督型複数物体追跡について検討する。
オブジェクトアソシエーションのための微分可能なソフトオブジェクト割り当てを提案する。
提案手法は,KITTI,nuScenes,Argoverseのデータセットを用いて評価する。
- 参考スコア(独自算出の注目度): 45.77333923477176
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we study self-supervised multiple object tracking without using
any video-level association labels. We propose to cast the problem of multiple
object tracking as learning the frame-wise associations between detections in
consecutive frames. To this end, we propose differentiable soft object
assignment for object association, making it possible to learn features
tailored to object association with differentiable end-to-end training. With
this training approach in hand, we develop an appearance-based model for
learning instance-aware object features used to construct a cost matrix based
on the pairwise distances between the object features. We train our model using
temporal and multi-view data, where we obtain association pseudo-labels using
optical flow and disparity information. Unlike most self-supervised tracking
methods that rely on pretext tasks for learning the feature correspondences,
our method is directly optimized for cross-object association in complex
scenarios. As such, the proposed method offers a reidentification-based MOT
approach that is robust to training hyperparameters and does not suffer from
local minima, which are a challenge in self-supervised methods. We evaluate our
proposed model on the KITTI, Waymo, nuScenes, and Argoverse datasets,
consistently improving over other unsupervised methods ($7.8\%$ improvement in
association accuracy on nuScenes).
- Abstract(参考訳): 本研究では,ビデオレベルのアソシエーションラベルを使わずに,自己監督型複数物体追跡について検討する。
本稿では,連続フレームにおける検出間のフレームワイドな関連を学習する手段として,複数物体追跡の問題を提案する。
そこで本研究では,オブジェクトアソシエイトに適した特徴を学習し,オブジェクトアソシエイトに対する識別可能なソフトオブジェクトアロケーションを提案する。
この学習手法により,オブジェクト特徴間のペア距離に基づいてコスト行列を構築するために使用される,インスタンス認識オブジェクト特徴を学習するための外観モデルを開発する。
我々は,時間的および多視点データを用いてモデルを訓練し,光学的流れと異質性情報を用いた連想擬似ラベルを得る。
特徴対応を学習するためのプリテキストタスクに依存するほとんどの自己教師付きトラッキング手法とは異なり、複雑なシナリオにおけるクロスオブジェクトアソシエーションに直接最適化されている。
そこで,提案手法は,ハイパーパラメータのトレーニングに頑健であり,局所的ミニマムに支障を来さない再同定に基づくmotアプローチを提供する。
提案モデルをkitti,waymo,nuscenes,argoverseデータセット上で評価し,教師なしの他の手法に対して一貫して改善する (7.8\%$$,nuscenesの関連精度向上)。
関連論文リスト
- VOVTrack: Exploring the Potentiality in Videos for Open-Vocabulary Object Tracking [61.56592503861093]
オープンボキャブラリオブジェクト検出(OVD)とマルチオブジェクトトラッキング(MOT)の複雑さを両立させる。
OVMOT の既存のアプローチは、OVD と MOT の方法論を別個のモジュールとして統合することが多く、主に画像中心のレンズによる問題に焦点を当てている。
VOVTrackは、MOTとビデオ中心トレーニングに関連するオブジェクト状態を統合する新しい手法であり、ビデオオブジェクト追跡の観点からこの問題に対処する。
論文 参考訳(メタデータ) (2024-10-11T05:01:49Z) - Collecting Consistently High Quality Object Tracks with Minimal Human Involvement by Using Self-Supervised Learning to Detect Tracker Errors [16.84474849409625]
高品質なオブジェクトトラックを一貫して作成するためのフレームワークを提案する。
鍵となるアイデアは、各データセットのモジュールを調整して、オブジェクトトラッカの障害をインテリジェントに判断することだ。
提案手法は,未収録ビデオの自己教師型学習を利用して,対象対象の表現をカスタマイズした表現を学習する。
論文 参考訳(メタデータ) (2024-05-06T17:06:32Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - End-to-end Tracking with a Multi-query Transformer [96.13468602635082]
マルチオブジェクトトラッキング(MOT)は、時間とともにシーン内のオブジェクトの位置、外観、アイデンティティを同時に推論する必要がある課題である。
本研究の目的は、トラッキング・バイ・ディテクト・アプローチを超えて、未知のオブジェクト・クラスに対してもよく機能するクラスに依存しないトラッキングへと移行することである。
論文 参考訳(メタデータ) (2022-10-26T10:19:37Z) - Transformer-based assignment decision network for multiple object
tracking [0.0]
本稿では,データアソシエーションに取り組むトランスフォーマーベースのアサインメント決定ネットワーク(TADN)について,推論中に明示的な最適化を必要とせずに紹介する。
提案手法は,トラッカーとしての単純な性質にもかかわらず,ほとんどの評価指標において最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-08-06T19:47:32Z) - Learning to Track with Object Permanence [61.36492084090744]
共同物体の検出と追跡のためのエンドツーエンドのトレーニング可能なアプローチを紹介します。
私たちのモデルは、合成データと実データで共同トレーニングされ、KITTIおよびMOT17データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2021-03-26T04:43:04Z) - Discriminative Appearance Modeling with Multi-track Pooling for
Real-time Multi-object Tracking [20.66906781151]
マルチオブジェクトトラッキングでは、トラッカーはそのメモリ内にシーンの各オブジェクトの外観と動き情報を保持する。
多くのアプローチは、それぞれのターゲットを分離してモデル化し、シーン内のすべてのターゲットを使用してメモリを共同で更新する能力がない。
オンライン上でハードトラッキングのエピソードを生成するマルチトラックプーリングに適応したトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2021-01-28T18:12:39Z) - SoDA: Multi-Object Tracking with Soft Data Association [75.39833486073597]
マルチオブジェクトトラッキング(MOT)は、自動運転車の安全な配備の前提条件である。
観測対象間の依存関係をエンコードするトラック埋め込みの計算に注目するMOTに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-08-18T03:40:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。