論文の概要: MOTRv3: Release-Fetch Supervision for End-to-End Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2305.14298v1
- Date: Tue, 23 May 2023 17:40:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 13:56:03.030192
- Title: MOTRv3: Release-Fetch Supervision for End-to-End Multi-Object Tracking
- Title(参考訳): MOTRv3: エンドツーエンドマルチオブジェクト追跡のためのリリース・フェッチ・スーパービジョン
- Authors: En Yu, Tiancai Wang, Zhuoling Li, Yuang Zhang, Xiangyu Zhang, Wenbing
Tao
- Abstract要約: 開発したリリース・フェッチ管理戦略を用いてラベル割り当てプロセスのバランスをとるMOTRv3を提案する。
また, 擬似ラベル蒸留法とトラック群認知法という2つの手法は, 検出・関連性の向上を図っている。
- 参考スコア(独自算出の注目度): 27.493264998858955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although end-to-end multi-object trackers like MOTR enjoy the merits of
simplicity, they suffer from the conflict between detection and association
seriously, resulting in unsatisfactory convergence dynamics. While MOTRv2
partly addresses this problem, it demands an additional detection network for
assistance. In this work, we serve as the first to reveal that this conflict
arises from the unfair label assignment between detect queries and track
queries during training, where these detect queries recognize targets and track
queries associate them. Based on this observation, we propose MOTRv3, which
balances the label assignment process using the developed release-fetch
supervision strategy. In this strategy, labels are first released for detection
and gradually fetched back for association. Besides, another two strategies
named pseudo label distillation and track group denoising are designed to
further improve the supervision for detection and association. Without the
assistance of an extra detection network during inference, MOTRv3 achieves
impressive performance across diverse benchmarks, e.g., MOT17, DanceTrack.
- Abstract(参考訳): MOTRのようなエンドツーエンドのマルチオブジェクトトラッカーは単純さの利点を享受するが、検出と関連性の対立に悩まされ、不満足な収束ダイナミクスをもたらす。
MOTRv2は部分的にこの問題に対処するが、補助のために追加の検知ネットワークを必要とする。
本研究は,クエリ検出とトレーニング中のクエリ追跡の不正なラベル割り当てから,クエリ検出がターゲットを認識し,関連するクエリを追跡するという,この競合を最初に明らかにするものである。
そこで本研究では,本手法を用いてラベル割当プロセスのバランスをとるmotrv3を提案する。
この戦略では、ラベルは最初に検出のためにリリースされ、徐々に関連付けられていく。
さらにpseudo label distillationとtrack group denoisingという別の2つの戦略は、検出と関連付けの監督をさらに改善するために設計されている。
推論中に追加の検知ネットワークの助けがなければ、MOTRv3はMOT17やDanceTrackといった様々なベンチマークで優れたパフォーマンスを達成できる。
関連論文リスト
- ADA-Track: End-to-End Multi-Camera 3D Multi-Object Tracking with Alternating Detection and Association [15.161640917854363]
多視点カメラによる3D MOTのための新しいエンドツーエンドフレームワークであるADA-Trackを紹介する。
エッジ拡張型クロスアテンションに基づく学習可能なデータアソシエーションモジュールを提案する。
我々は、この関連モジュールをDTRベースの3D検出器のデコーダ層に統合する。
論文 参考訳(メタデータ) (2024-05-14T19:02:33Z) - Single-Shot and Multi-Shot Feature Learning for Multi-Object Tracking [55.13878429987136]
そこで本研究では,異なる目標に対して,単発と複数発の特徴を共同で学習するための,シンプルで効果的な2段階特徴学習パラダイムを提案する。
提案手法は,DanceTrackデータセットの最先端性能を達成しつつ,MOT17およびMOT20データセットの大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-11-17T08:17:49Z) - Bridging the Gap Between End-to-end and Non-End-to-end Multi-Object
Tracking [27.74953961900086]
既存のエンドツーエンドのマルチオブジェクト追跡(e2e-MOT)手法は、非エンドツーエンドのトラッキング・バイ・検出手法を超えていない。
本稿では,e2e-MOT をシャドウ概念を用いた新しいラベル割り当てにより,簡便かつ効果的な方法である Co-MOT を提案する。
論文 参考訳(メタデータ) (2023-05-22T05:18:34Z) - MOTRv2: Bootstrapping End-to-End Multi-Object Tracking by Pretrained
Object Detectors [14.69168925956635]
MOTRv2は、事前訓練されたオブジェクト検出器でエンドツーエンドのマルチオブジェクト追跡をブートストラップするパイプラインである。
ダンストラックでは73.4% HOTAが第1位であり、グループ・ダンス・チャレンジでは第1位にランクインしている。
BDD100Kデータセットで最先端のパフォーマンスに達する。
論文 参考訳(メタデータ) (2022-11-17T18:57:12Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Distractor-Aware Fast Tracking via Dynamic Convolutions and MOT
Philosophy [63.91005999481061]
実用的長期トラッカーは、典型的には3つの重要な特性を含む。
効率的なモデル設計、効果的なグローバル再検出戦略、堅牢な気晴らし認識メカニズム。
動的畳み込み (d-convs) と多重オブジェクト追跡 (MOT) の哲学を用いて, 注意をそらした高速トラッキングを実現するための2タスクトラッキングフレームワーク(DMTrack)を提案する。
我々のトラッカーはLaSOT, OxUvA, TLP, VOT2018LT, VOT 2019LTベンチマークの最先端性能を実現し, リアルタイム3倍高速に動作させる。
論文 参考訳(メタデータ) (2021-04-25T00:59:53Z) - Object Detection Made Simpler by Eliminating Heuristic NMS [70.93004137521946]
単純なNMSのないエンドツーエンドのオブジェクト検出フレームワークを示す。
検出精度は元の1段検出器と比べて同等か、さらに向上した。
論文 参考訳(メタデータ) (2021-01-28T02:38:29Z) - Rethinking the competition between detection and ReID in Multi-Object
Tracking [44.59367033562385]
検出と識別の埋め込みを共同で学習するワンショットモデルは、マルチオブジェクトトラッキング(MOT)において大きな注目を集めている。
本稿では,タスク依存表現をよりよく学習するために,自己関係と相互関係を持つ新しい相互ネットワーク(REN)を提案する。
また,ID埋め込みの関連性を改善するために,意味レベルのミスアライメントを防止するスケールアウェア・アテンション・ネットワーク(SAAN)を導入する。
論文 参考訳(メタデータ) (2020-10-23T02:44:59Z) - Dense Scene Multiple Object Tracking with Box-Plane Matching [73.54369833671772]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要なタスクである。
密集したシーンにおけるMOT性能を改善するために,Box-Plane Matching (BPM)法を提案する。
3つのモジュールの有効性により、ACM MM Grand Challenge HiEve 2020において、私たちのチームはトラック1のリーダーボードで1位を獲得しました。
論文 参考訳(メタデータ) (2020-07-30T16:39:22Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。