Fugu-MT 論文翻訳(概要): Multiple Object Tracking as ID Prediction

論文の概要: Multiple Object Tracking as ID Prediction

arxiv url: http://arxiv.org/abs/2403.16848v2
Date: Mon, 24 Mar 2025 14:23:00 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-25 16:32:16.035517
Title: Multiple Object Tracking as ID Prediction
Title（参考訳）: ID予測としての複数物体追跡
Authors: Ruopeng Gao, Ji Qi, Limin Wang,
Abstract要約: マルチオブジェクト追跡(MOT)は、ビデオ理解における長年の課題である。我々は、複数のオブジェクト追跡をコンテキスト内ID予測タスクとして扱う新しい視点を導入する。そこで本研究では,MOTIPと呼ばれるシンプルで効果的な手法を提案する。
参考スコア（独自算出の注目度）: 17.874070679534032
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multi-Object Tracking (MOT) has been a long-standing challenge in video understanding. A natural and intuitive approach is to split this task into two parts: object detection and association. Most mainstream methods employ meticulously crafted heuristic techniques to maintain trajectory information and compute cost matrices for object matching. Although these methods can achieve notable tracking performance, they often require a series of elaborate handcrafted modifications while facing complicated scenarios. We believe that manually assumed priors limit the method's adaptability and flexibility in learning optimal tracking capabilities from domain-specific data. Therefore, we introduce a new perspective that treats Multiple Object Tracking as an in-context ID Prediction task, transforming the aforementioned object association into an end-to-end trainable task. Based on this, we propose a simple yet effective method termed MOTIP. Given a set of trajectories carried with ID information, MOTIP directly decodes the ID labels for current detections to accomplish the association process. Without using tailored or sophisticated architectures, our method achieves state-of-the-art results across multiple benchmarks by solely leveraging object-level features as tracking cues. The simplicity and impressive results of MOTIP leave substantial room for future advancements, thereby making it a promising baseline for subsequent research. Our code and checkpoints are released at https://github.com/MCG-NJU/MOTIP.
Abstract（参考訳）: マルチオブジェクト追跡(MOT)は、ビデオ理解における長年の課題である。自然な直感的なアプローチは、このタスクをオブジェクトの検出と関連性という2つの部分に分割することです。ほとんどの主流の手法では、軌跡情報を維持し、オブジェクトマッチングのコスト行列を計算するために、巧妙に造られたヒューリスティックな手法が採用されている。これらの手法は、顕著な追跡性能を達成することができるが、複雑なシナリオに直面しながら、手作りの細かな修正を必要とすることが多い。ドメイン固有のデータから最適なトラッキング能力を学習する際のメソッドの適応性と柔軟性を,手動で前提とする手法が制限されている,と我々は信じている。そこで本稿では,複数のオブジェクト追跡をコンテキスト内ID予測タスクとして扱う新たな視点を導入し,上記のオブジェクト関連をエンドツーエンドのトレーニング可能なタスクに変換する。そこで本研究では,MOTIPと呼ばれるシンプルで効果的な手法を提案する。 ID情報を含む一連のトラジェクトリが与えられた場合、MOTIPは、現在の検出のためにIDラベルを直接デコードして、関連プロセスを達成する。提案手法は,高度アーキテクチャを使わずに,オブジェクトレベルの特徴をトラッキングキューとしてのみ活用することにより,複数のベンチマークで最先端の結果を達成している。 MOTIPの単純で印象的な結果は、将来の進歩に十分な余地を残し、その後の研究のベースラインとなる。私たちのコードとチェックポイントはhttps://github.com/MCG-NJU/MOTIPで公開されています。

関連論文リスト

Multi-object Tracking by Detection and Query: an efficient end-to-end manner [23.926668750263488]
従来の検出によるトラッキングと、クエリによる新たなトラッキングだ。本稿では,学習可能なアソシエータによって達成されるトラッキング・バイ・検出・クエリーのパラダイムを提案する。トラッキング・バイ・クエリーモデルと比較すると、LAIDは特に訓練効率の高い競合追跡精度を達成している。
論文参考訳（メタデータ） (2024-11-09T14:38:08Z)
VOVTrack: Exploring the Potentiality in Videos for Open-Vocabulary Object Tracking [61.56592503861093]
オープンボキャブラリオブジェクト検出(OVD)とマルチオブジェクトトラッキング(MOT)の複雑さを両立させる。 OVMOT の既存のアプローチは、OVD と MOT の方法論を別個のモジュールとして統合することが多く、主に画像中心のレンズによる問題に焦点を当てている。 VOVTrackは、MOTとビデオ中心トレーニングに関連するオブジェクト状態を統合する新しい手法であり、ビデオオブジェクト追跡の観点からこの問題に対処する。
論文参考訳（メタデータ） (2024-10-11T05:01:49Z)
Lost and Found: Overcoming Detector Failures in Online Multi-Object Tracking [15.533652456081374]
マルチオブジェクト追跡(MOT)は、時間とともに複数のオブジェクトのアイデンティティと位置を正確に推定する。現代の検出器は、あるフレーム内のいくつかのオブジェクトを見逃すことがあるため、トラッカーは早めに追跡をやめる。オンラインTbDシステムと互換性のある汎用フレームワークであるBUSCAを提案する。
論文参考訳（メタデータ） (2024-07-14T10:45:12Z)
Single-Shot and Multi-Shot Feature Learning for Multi-Object Tracking [55.13878429987136]
そこで本研究では,異なる目標に対して,単発と複数発の特徴を共同で学習するための,シンプルで効果的な2段階特徴学習パラダイムを提案する。提案手法は,DanceTrackデータセットの最先端性能を達成しつつ,MOT17およびMOT20データセットの大幅な改善を実現している。
論文参考訳（メタデータ） (2023-11-17T08:17:49Z)
SparseTrack: Multi-Object Tracking by Performing Scene Decomposition based on Pseudo-Depth [84.64121608109087]
2次元画像から目標の相対的な深さを求めるための擬似深度推定法を提案する。次に,得られた深度情報を用いて,高密度なターゲットセットを複数のスパースなターゲットサブセットに変換するディープカスケードマッチング(DCM)アルゴリズムを設計する。擬似深度法とDCM戦略をデータアソシエーションプロセスに統合することにより、SparseTrackと呼ばれる新しいトラッカーを提案する。
論文参考訳（メタデータ） (2023-06-08T14:36:10Z)
Bridging the Gap Between End-to-end and Non-End-to-end Multi-Object Tracking [27.74953961900086]
既存のエンドツーエンドのマルチオブジェクト追跡(e2e-MOT)手法は、非エンドツーエンドのトラッキング・バイ・検出手法を超えていない。本稿では,e2e-MOT をシャドウ概念を用いた新しいラベル割り当てにより,簡便かつ効果的な方法である Co-MOT を提案する。
論文参考訳（メタデータ） (2023-05-22T05:18:34Z)
Unifying Tracking and Image-Video Object Detection [54.91658924277527]
TrIVD (Tracking and Image-Video Detection) は、画像OD、ビデオOD、MOTを1つのエンドツーエンドモデルに統合する最初のフレームワークである。カテゴリラベルの相違やセマンティックな重複に対処するため、TrIVDは対象カテゴリに対する検出/追跡を基礎と理由として定式化している。
論文参考訳（メタデータ） (2022-11-20T20:30:28Z)
End-to-end Tracking with a Multi-query Transformer [96.13468602635082]
マルチオブジェクトトラッキング(MOT)は、時間とともにシーン内のオブジェクトの位置、外観、アイデンティティを同時に推論する必要がある課題である。本研究の目的は、トラッキング・バイ・ディテクト・アプローチを超えて、未知のオブジェクト・クラスに対してもよく機能するクラスに依存しないトラッキングへと移行することである。
論文参考訳（メタデータ） (2022-10-26T10:19:37Z)
EnsembleMOT: A Step towards Ensemble Learning of Multiple Object Tracking [18.741196817925534]
複数オブジェクト追跡(MOT)は近年急速に進歩している。そこで我々は,EnsembleMOTと呼ばれるMOTのためのシンプルだが効果的なアンサンブル手法を提案する。本手法はモデル非依存であり,学習手順は不要である。
論文参考訳（メタデータ） (2022-10-11T09:18:01Z)
Transformer-based assignment decision network for multiple object tracking [0.0]
本稿では,データアソシエーションに取り組むトランスフォーマーベースのアサインメント決定ネットワーク(TADN)について,推論中に明示的な最適化を必要とせずに紹介する。提案手法は,トラッカーとしての単純な性質にもかかわらず,ほとんどの評価指標において最先端の手法よりも優れている。
論文参考訳（メタデータ） (2022-08-06T19:47:32Z)
Unified Transformer Tracker for Object Tracking [58.65901124158068]
異なるシナリオにおけるトラッキング問題に1つのパラダイムで対処するために,UTT(Unified Transformer Tracker)を提案する。 SOT(Single Object Tracking)とMOT(Multiple Object Tracking)の両方を対象とするトラックトランスフォーマーを開発した。
論文参考訳（メタデータ） (2022-03-29T01:38:49Z)
Distractor-Aware Fast Tracking via Dynamic Convolutions and MOT Philosophy [63.91005999481061]
実用的長期トラッカーは、典型的には3つの重要な特性を含む。効率的なモデル設計、効果的なグローバル再検出戦略、堅牢な気晴らし認識メカニズム。動的畳み込み (d-convs) と多重オブジェクト追跡 (MOT) の哲学を用いて, 注意をそらした高速トラッキングを実現するための2タスクトラッキングフレームワーク(DMTrack)を提案する。我々のトラッカーはLaSOT, OxUvA, TLP, VOT2018LT, VOT 2019LTベンチマークの最先端性能を実現し, リアルタイム3倍高速に動作させる。
論文参考訳（メタデータ） (2021-04-25T00:59:53Z)
Learning to Track with Object Permanence [61.36492084090744]
共同物体の検出と追跡のためのエンドツーエンドのトレーニング可能なアプローチを紹介します。私たちのモデルは、合成データと実データで共同トレーニングされ、KITTIおよびMOT17データセットの最先端を上回ります。
論文参考訳（メタデータ） (2021-03-26T04:43:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。