Fugu-MT 論文翻訳(概要): Multi-object Tracking by Detection and Query: an efficient end-to-end manner

論文の概要: Multi-object Tracking by Detection and Query: an efficient end-to-end manner

arxiv url: http://arxiv.org/abs/2411.06197v1
Date: Sat, 09 Nov 2024 14:38:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:46.10244
Title: Multi-object Tracking by Detection and Query: an efficient end-to-end manner
Title（参考訳）: 検出とクエリによる多目的追跡:効率的なエンドツーエンド手法
Authors: Shukun Jia, Yichao Cao, Feng Yang, Xin Lu, Xiaobo Lu,
Abstract要約: 従来の検出によるトラッキングと、クエリによる新たなトラッキングだ。本稿では,学習可能なアソシエータによって達成されるトラッキング・バイ・検出・クエリーのパラダイムを提案する。トラッキング・バイ・クエリーモデルと比較すると、LAIDは特に訓練効率の高い競合追跡精度を達成している。
参考スコア（独自算出の注目度）: 23.926668750263488
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-object tracking is advancing through two dominant paradigms: traditional tracking by detection and newly emerging tracking by query. In this work, we fuse them together and propose the tracking-by-detection-and-query paradigm, which is achieved by a Learnable Associator. Specifically, the basic information interaction module and the content-position alignment module are proposed for thorough information Interaction among object queries. Tracking results are directly Decoded from these queries. Hence, we name the method as LAID. Compared to tracking-by-query models, LAID achieves competitive tracking accuracy with notably higher training efficiency. With regard to tracking-by-detection methods, experimental results on DanceTrack show that LAID significantly surpasses the state-of-the-art heuristic method by 3.9% on HOTA metric and 6.1% on IDF1 metric. On SportsMOT, LAID also achieves the best score on HOTA metric. By holding low training cost, strong tracking capabilities, and an elegant end-to-end approach all at once, LAID presents a forward-looking direction for the field.
Abstract（参考訳）: 従来の検出によるトラッキングと、クエリによる新たなトラッキングだ。本研究では,これらを融合させ,学習可能なアソシエータによって達成されるトラッキング・バイ・検出・クエリ・パラダイムを提案する。具体的には、オブジェクトクエリ間の詳細な情報インタラクションのために、基本的な情報インタラクションモジュールとコンテンツ配置アライメントモジュールを提案する。追跡結果はこれらのクエリから直接デコードされる。したがって、この手法をLAIDと命名する。トラッキング・バイ・クエリーモデルと比較すると、LAIDは特に訓練効率の高い競合追跡精度を達成している。トラッキング・バイ・ディテククション法に関して、DanceTrack実験の結果、LAIDは最先端のヒューリスティック法をHOTAで3.9%、IDF1で6.1%大きく上回った。また、SportsMOTでは、LAIDはHOTAで最高のスコアを獲得している。低トレーニングコスト、強力なトラッキング機能、エレガントなエンドツーエンドアプローチを一度に保持することで、LAIDはフィールドの前方方向を示す。

関連論文リスト

From Detection to Association: Learning Discriminative Object Embeddings for Multi-Object Tracking [24.903851740154433]
本稿では,3つの視点にまたがってオブジェクトの識別性を高める明示的な特徴フレームワークを提案する。実験によると、SpngeBobAはDanceTrack、SportsMOT、BFTなど、複数の挑戦的なMOTベンチマークで最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (2025-12-02T04:04:39Z)
CAMELTrack: Context-Aware Multi-cue ExpLoitation for Online Multi-Object Tracking [68.24998698508344]
CAMELはコンテキスト対応型マルチキューExpLoitationのための新しいアソシエイトモジュールである。エンド・ツー・エンドの検知・バイ・トラック方式とは異なり,本手法は軽量かつ高速にトレーニングが可能であり,外部のオフ・ザ・シェルフモデルを活用することができる。提案するオンライントラッキングパイプラインであるCAMELTrackは,複数のトラッキングベンチマークで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-05-02T13:26:23Z)
SynCL: A Synergistic Training Strategy with Instance-Aware Contrastive Learning for End-to-End Multi-Camera 3D Tracking [34.90147791481045]
SynCLは、検出と追跡のためのマルチタスク学習を共用するために設計された、新しいプラグアンドプレイのシナジスティックトレーニング戦略である。各種クエリベースの3D MOTトラッカーのトレーニング段階と統合した場合,SynCLは一貫して改善されていることを示す。追加の推論コストなしで、SynCLは最先端のPF-Trackメソッドを$+3.9%のAMOTAと$+2.0%のNDSで改善した。
論文参考訳（メタデータ） (2024-11-11T08:18:49Z)
Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。 TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2024-07-19T07:48:45Z)
ADA-Track: End-to-End Multi-Camera 3D Multi-Object Tracking with Alternating Detection and Association [15.161640917854363]
多視点カメラによる3D MOTのための新しいエンドツーエンドフレームワークであるADA-Trackを紹介する。エッジ拡張型クロスアテンションに基づく学習可能なデータアソシエーションモジュールを提案する。我々は、この関連モジュールをDTRベースの3D検出器のデコーダ層に統合する。
論文参考訳（メタデータ） (2024-05-14T19:02:33Z)
Single-Shot and Multi-Shot Feature Learning for Multi-Object Tracking [55.13878429987136]
そこで本研究では,異なる目標に対して,単発と複数発の特徴を共同で学習するための,シンプルで効果的な2段階特徴学習パラダイムを提案する。提案手法は,DanceTrackデータセットの最先端性能を達成しつつ,MOT17およびMOT20データセットの大幅な改善を実現している。
論文参考訳（メタデータ） (2023-11-17T08:17:49Z)
Bridging the Gap Between End-to-end and Non-End-to-end Multi-Object Tracking [27.74953961900086]
既存のエンドツーエンドのマルチオブジェクト追跡(e2e-MOT)手法は、非エンドツーエンドのトラッキング・バイ・検出手法を超えていない。本稿では,e2e-MOT をシャドウ概念を用いた新しいラベル割り当てにより,簡便かつ効果的な方法である Co-MOT を提案する。
論文参考訳（メタデータ） (2023-05-22T05:18:34Z)
You Only Need Two Detectors to Achieve Multi-Modal 3D Multi-Object Tracking [9.20064374262956]
提案手法は,2次元検出器と3次元検出器のみを用いて,ロバストなトラッキングを実現する。多くの最先端のTBDベースのマルチモーダルトラッキング手法よりも正確であることが証明されている。
論文参考訳（メタデータ） (2023-04-18T02:45:18Z)
OmniTracker: Unifying Object Tracking by Tracking-with-Detection [119.51012668709502]
OmniTrackerは、完全に共有されたネットワークアーキテクチャ、モデルウェイト、推論パイプラインですべてのトラッキングタスクを解決するために提供されている。 LaSOT、TrackingNet、DAVIS16-17、MOT17、MOTS20、YTVIS19を含む7つの追跡データセットの実験は、OmniTrackerがタスク固有の追跡モデルと統合された追跡モデルの両方よりも、オンパーまたはそれ以上の結果を達成することを示した。
論文参考訳（メタデータ） (2023-03-21T17:59:57Z)
3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文参考訳（メタデータ） (2022-11-01T20:59:38Z)
End-to-end Tracking with a Multi-query Transformer [96.13468602635082]
マルチオブジェクトトラッキング(MOT)は、時間とともにシーン内のオブジェクトの位置、外観、アイデンティティを同時に推論する必要がある課題である。本研究の目的は、トラッキング・バイ・ディテクト・アプローチを超えて、未知のオブジェクト・クラスに対してもよく機能するクラスに依存しないトラッキングへと移行することである。
論文参考訳（メタデータ） (2022-10-26T10:19:37Z)
Transformer-based assignment decision network for multiple object tracking [2.2920634931825803]
本稿では,データアソシエーションに取り組むトランスフォーマーベースのアサインメント決定ネットワーク(TADN)について,推論中に明示的な最適化を必要とせずに紹介する。提案手法は,トラッカーとしての単純な性質にもかかわらず,ほとんどの評価指標において高い性能を示す。
論文参考訳（メタデータ） (2022-08-06T19:47:32Z)
Unified Transformer Tracker for Object Tracking [58.65901124158068]
異なるシナリオにおけるトラッキング問題に1つのパラダイムで対処するために,UTT(Unified Transformer Tracker)を提案する。 SOT(Single Object Tracking)とMOT(Multiple Object Tracking)の両方を対象とするトラックトランスフォーマーを開発した。
論文参考訳（メタデータ） (2022-03-29T01:38:49Z)
Joint Feature Learning and Relation Modeling for Tracking: A One-Stream Framework [76.70603443624012]
特徴学習と関係モデリングを統合した新しい一ストリーム追跡(OSTrack)フレームワークを提案する。このようにして、相互誘導により識別的目標指向特徴を動的に抽出することができる。 OSTrackは、複数のベンチマークで最先端のパフォーマンスを実現しており、特に、ワンショットトラッキングベンチマークのGOT-10kでは印象的な結果を示している。
論文参考訳（メタデータ） (2022-03-22T18:37:11Z)
DSRRTracker: Dynamic Search Region Refinement for Attention-based Siamese Multi-Object Tracking [13.104037155691644]
本稿では,ガウスフィルタにインスパイアされた動的探索領域改良モジュールを用いたエンドツーエンドMOT法を提案する。提案手法は,最先端の性能を妥当な速度で達成することができる。
論文参考訳（メタデータ） (2022-03-21T04:14:06Z)
Exploring Simple 3D Multi-Object Tracking for Autonomous Driving [10.921208239968827]
LiDARポイントクラウドにおける3Dマルチオブジェクトトラッキングは、自動運転車にとって重要な要素である。既存の手法は、主にトラッキング・バイ・検出パイプラインに基づいており、検出アソシエーションのマッチングステップが必然的に必要である。我々は,手作りの追跡パラダイムをシンプルにするために,原点雲からの共同検出と追跡のためのエンドツーエンドのトレーニング可能なモデルを提案する。
論文参考訳（メタデータ） (2021-08-23T17:59:22Z)
Distractor-Aware Fast Tracking via Dynamic Convolutions and MOT Philosophy [63.91005999481061]
実用的長期トラッカーは、典型的には3つの重要な特性を含む。効率的なモデル設計、効果的なグローバル再検出戦略、堅牢な気晴らし認識メカニズム。動的畳み込み (d-convs) と多重オブジェクト追跡 (MOT) の哲学を用いて, 注意をそらした高速トラッキングを実現するための2タスクトラッキングフレームワーク(DMTrack)を提案する。我々のトラッカーはLaSOT, OxUvA, TLP, VOT2018LT, VOT 2019LTベンチマークの最先端性能を実現し, リアルタイム3倍高速に動作させる。
論文参考訳（メタデータ） (2021-04-25T00:59:53Z)
DEFT: Detection Embeddings for Tracking [3.326320568999945]
我々は,DEFT と呼ばれる効率的な関節検出・追跡モデルを提案する。提案手法は,外見に基づくオブジェクトマッチングネットワークと,下層のオブジェクト検出ネットワークとの協調学習に依存している。 DEFTは2Dオンライントラッキングリーダーボードのトップメソッドに匹敵する精度とスピードを持っている。
論文参考訳（メタデータ） (2021-02-03T20:00:44Z)
TAO: A Large-Scale Benchmark for Tracking Any Object [95.87310116010185]
オブジェクトのデータセットの追跡は2,907本の高解像度ビデオで構成され、平均で30分の長さの多様な環境でキャプチャされる。ビデオの任意の時点で移動するオブジェクトにアノテータにラベルを付け、ファクトラムの後に名前を付けるように求めます。我々の語彙は、既存の追跡データセットと著しく大きく、質的に異なる。
論文参考訳（メタデータ） (2020-05-20T21:07:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。